詞條
詞條說明
互聯網、物聯網、無線傳感網絡、社交網絡等新興技術趨勢促使人類社會的數據種類和規模正以**的速度增長,大數據時代正式到來。數據正從簡單的記錄對象開始轉變為一種基礎性甚至戰略性的資源,從海量的低**密度的結構化和非結構化數據中獲取有**的信息,已經成為各行業*關注的焦點。 在大數據之中有一個重要概念,那就是數據相關性。大數據不是教機器像人一樣思考,而是將復雜的數學算法用在海量數據上,讓數據自己說
在信息化高度發達的今天,互聯網已經成為人們獲取信息,即時溝通的重要媒介之一,給人們工作生活帶來了很大的便利。但是由于其**性、開放性、即時性的特點,互聯網也成為眾多信息傳播的重要途徑,與傳統媒體相比較為棘手。如何對互聯網進行有效的管理,過濾其中的不良信息,凈化網絡環境成為苛待解決的問題。 目前網絡中70%的信息是以文本形式存在,網頁文本過濾成為目前網絡監控的較重要手段。文本過濾方法有很多,關鍵字
文本挖掘(Text Mining)是一個從結構化或非結構化文本信息中獲取用戶感興趣或者有用的模式的過程。文本挖掘的主要目的是從非結構化文本文檔中提取有趣的、重要的模式和知識。可以看成是基于數據庫的數據挖掘或知識發現的擴展。 文本挖掘是從數據挖掘發展而來,因此其定義與我們熟知的數據挖掘定義相類似。但與傳統的數據挖掘相比,文本挖掘有其*特之處,主要表現在:文檔本身是半結構化或非結構化的,無確定形式并
隨著互聯網技術的快速發展和普及,人們可以在網絡上獲得各種信息,怎樣防止青少年接觸到不健康內容是一個嚴肅的社會問題。要防止不健康、無用內容的蔓延,除了從法律角度采取措施外,從技術角度考慮的網絡過濾技術是一種有效的手段。 目前網絡的信息過濾技術主要有三種,它們是基于URL過濾方式、基于文本的過濾方式和基于圖像內容的過濾方式。這幾種過濾技術各有優劣,有的實現比較簡單,有的具有較廣泛的適應性,有的效率高
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: