2011年11月26日 星期六

資訊檢索專有名詞的台灣與大陸用語對照表

最近神經神經的,接了一個Case,做Manning, C. D, Raghavan, R., & Schutze, H.寫的"Introduction to Information Retrieval"繁體中文版(大陸把英文翻成簡體中文、我們把簡體中文翻成繁體中文)的校訂工作,校訂的重點是把大陸的專有名詞、技術用語的用法改為台灣用法。原本以為還好才接下來的,想不到花的功夫遠超過我想像。


總算交差了,不過對我而言,唯一的By Product是底下的這份對照表:



大陸用語
台灣用語
大陸用語
台灣用語
概率
機率
魯棒
強韌
反饋
回饋
文檔
文件
貝葉斯
貝氏
似然
可能性
優勢比
勝算比
返回
回傳
評價
評估
冗余
冗餘
偽相關回饋
準相關回饋
思路
構想
余弦
餘弦
樸素貝氏
簡單貝氏
調優
調整
先驗機率
事前機率
後驗機率
事後機率
歸一化
正規化
信息
資訊
有窮自動機
有限自動機
形式語言
正規語言
方差
變異數
短語
片語
開源
開放原始碼
搜索引擎
搜尋引擎
萬維網
全球資訊網
正確率
查準率
召回率
查全率

詞頻

逆向文件頻率
隱式語義索引
隱含語意索引
開銷
成本
層次聚類
階層式分群
聚類
分群
無監督(學習)
非監督式(學習)
降維
維度縮減
用戶
使用者
交互
互動
面向XX
XX導向
默認
預設
流覽
瀏覽
標簽
標籤
倒排記錄
反向紀錄
倒排索引
反向索引
(cardinality)
基數
全局(Global)
全域
互資訊
交互資訊
真陽性/真正例
(true-positive)
正確正例
假陰性/偽反例
(false-negative)
錯誤負例
假陽性/偽正例
(false-positive)
錯誤正例
真陰性/真反例
(true-negative)
正確負例
偽代碼
虛擬程式碼
閾值
門檻值
拐點
轉折點
模式識別
圖形辨識
帶寬
頻寬
內網
企業內部網路
線程
執行緒
進程
程序
磁片
磁碟
哈希
雜湊
因特網
網際網路
互聯網
網際網路
錨文本
錨點文字
錨點
泊松
卜瓦松 (poisson)
元資訊
詮釋資料
通配符
萬用字元
尋道(seek)
尋軌
調用(call function)
呼叫
比特
位元
無損壓縮
無失真壓縮
有所壓縮
失真壓縮
B
B-Tree
自頂向下
由上而下
自底向上
由下而上
逆文檔頻率
逆向文件頻率
編程語言
程式語言
插值
內插
特異度(specificity)
明確性
邊緣統計量
邊際統計量
形式化(formal)
正式
頻度
頻率
民族志
民族誌
挖掘
探勘
從句(clause)
子句
代詞
代名詞
文本分類
文件分類
情感發現
(sentiment detection)
情感偵測
部件
元件
正規運算式/正則運算式
常規表示式(regular expression)
有監督的學習
監督式學習
過學習(overfitting)
過適
泛化
普遍化
坐標
座標
置信度
可信度
精確率(accuracy)
正確率
宏平均
宏觀平均
微平均
微觀平均
多模態
多重模態(multi-modal)
間隔
(margin in SVM)
邊界
函式庫(library)
點積
內積
權重電腦制
權重計算



        

1 則留言: