序
隨著網路的迅猛發展,巨量資料造成的“資訊過載”問題已經凸顯。近幾年興起的雲端計算和大數據分析,成為取得輿論情報的新途徑。主題網路輿論主要是指透過網路上的主流媒體網站對主題活動所發表的有較強影響力、傾向性的言論和觀點,是一定時期內國內外對主題活動的主觀反應。日趨複雜的國際政治環境與網路的快速發展,使得網路成為許多國家和政策研究機構表達政治立場、進行政治訴求的媒體平台。
在創新的網路知識組織理論架構和智慧資訊處理技術環境下,開展網路主題輿論的採集與分析研究方能更加深入。實施網路輿論智慧化採集,通用Web搜尋引擎已經難以完整收集所有領域和主題的網路資訊,即使收集比較全面也由於領域和主題範圍太寬,很難將各領域和主題都做得精確而又專業,從而導致檢索結果中無用資訊太多。而基於領域主題的Web搜尋引擎,針對某一特定領域、某一特定人群或某一特定需求提供有一定價值的資訊和相關服務,在網路上收集符合主題需要的資訊資源,以構築某一專題或學科領域的網路資訊資源庫。
建構主題搜尋引擎的核心技術之一就是主題導向的網路資訊採集技術。因此,對主題爬行技術的研究有重要的理論意義和應用價值。將知識技術與主題網路輿論分析過程相結合,研究基於知識技術的主題網路輿論分析框架,並對其中的關鍵技術進行研究,主要包括網路輿論知識模型建構、語義特徵抽取、基於語義的網路輿論資訊叢集和分類策略、網路輿論傾向性分析和分析框架原型建構。基於社交網路特性研究輿論傳播控制策略,開展主題網路輿論的分析並在技術上尋求突破則具有非常重要的現實意義。日益增長的輿論大數據資訊處理,要求從巨量語料資源中獲取語義知識,有效利用語義知識實現文字處理任務是目前更好地提供輿論服務的熱門研究課題。
本書將國內外領先的知識技術運用於網路輿論的採集和網路輿論的分析過程,盼能抛磚引玉,促進網路輿論採集、處理和服務方法與技術領域的深入研究,推動網路輿論資訊系統中新技術的研究和應用創新。