国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

谷歌發布大型數據集合 以研發準確翻譯軟件
2013-03-11   cnBeta

據外媒報道,谷歌于近日發布了一個大型數據集合--Wikilinks Corpus,它將可以幫助開發人員構建出可以準確解釋人類語言的軟件。Wikilinks Corpus中包含了來自各大網頁及維基百科文章的4000多萬條個人鏈接,它們則被稱為mention。開發人員則可以通過分析每一條mention的內容以及目標文章的內容,進而確定一些模棱兩可單詞的意思。

  谷歌在其Reaserch Blog中提出,人類非常擅長辨別同一個單詞在不同語境下的意思。比如說,當把dodge寫成Dodge時,它就是一個車子的品牌,而當寫成to dodge的時候,它就是一個動詞。

  跟谷歌搜索算法非常類似,Wikilinks Corpus也是由在來自馬薩諸塞大學阿默斯特分校的研究人員的協助下完成的,并且它的規模要比以往的數據集合都要來得大。更重要的是,它是免費的。雖然由于版權問題,谷歌無法發布個人網頁的實際內容,但是它卻可以提供獲得這些內容的代碼。

熱詞搜索:

上一篇:甲骨文再發Java安全更新 將會加快更新速度
下一篇:5000億 2013年物聯網將繼續成產業關注熱點

分享到: 收藏
主站蜘蛛池模板: 香河县| 新干县| 灵石县| 乳源| 循化| 亚东县| 仲巴县| 广汉市| 改则县| 娄底市| 和林格尔县| 阜新市| 哈巴河县| 福清市| 安多县| 雅安市| 宽甸| 永修县| 元阳县| 花莲市| 清远市| 九龙县| 合水县| 新田县| 阿克陶县| 桃源县| 米脂县| 开远市| 光山县| 彭山县| 鄱阳县| 蓬安县| 哈密市| 资阳市| 永宁县| 延寿县| 衢州市| 丹凤县| 石屏县| 房产| 新巴尔虎左旗|