跳到主要內容

搜尋此網誌

Tommas's blog 阿湯哥的部落格

自己踏入Windows, Mac OS X, Linux / Deep Leaning, Machine Leaning / Spark, 在研究所.. 等等所學習到的知識和筆記做一些心得整理分享！版權與智慧財產權聲明 : 保留所有法律權利。我在寫文章時如果有引用到其他人的地方，會盡量說明參考出處，如果有遺漏的地方請告訴我，會馬上註明! 而轉貼我的文章時也請您註明出處!

取得連結
Facebook
X
Pinterest
以電子郵件傳送
其他應用程式

標籤

AI & Big Data 技術筆記
NLP（自然語言處理）

Google釋出最新評估文字生成強健性的自動化指標BLEURT

Google釋出最新評估文字生成強健性的自動化指標BLEURT

News from: iThome & Google AI Blog.

Google運用預訓練技術，再以人工評估資料進行微調，讓BLEURT可以提供高精確度的自然語言評估結果。有鑒於現有的自動評估指標已經不敷使用，儼然成為自然語言生成技術的瓶頸，因此Google新開發了一個用來自動衡量文字產生強健性的指標BLEURT，能達到接近人類註釋的準確性，其準確度比常用的自動指標BLEU還高48％。

過去幾年自然語言生成技術的發展有長足的進步，可以使用越來越高級的方法，精確地翻譯文字、總結文章、進行對話甚至是發表圖片評論，而Google提到，目前評估自然文字產生系統有兩種方法，分別是人工評估以及自動化指標。人工評估是仰賴人工註釋者進行大規模的品質調查，註釋者會檢視系統所產生的文字，並評估其流暢性和含義的品質，這種方法雖然精確，但是卻相當費時，僅數千個範例可能就需要數十人參與評估，這將會破壞模型開發的工作流程。

相較於人工評估，自動評估是更為理想的方法，優點是更便宜且延遲低，自動評估通常以兩個句子作為輸入，一個是候選詞，另一個則是參照詞，評估系統藉由比較兩者相似度給出一個分數，目前常用的衡量標準為BLEU；自動指標與人工評估的優缺點剛好相反，自動指標可以在模型訓練的時候進行計算，回饋強化模型訓練，但是由於其評估僅是表面相似度，因此準確度不高，也無法擷取人類語言的多樣性。

Google認為，理想的評估方法，應該要兼具人工評估和自動指標的優點，計算過程成本應該盡量低廉，且又具有足夠靈活性應對語言多樣性。Google新發展的BLEURT，則是一個運用機器學習技術的自動指標，能夠捕捉句子間語意的相似性。

而訓練BLEURT模型的第一個問題，便是訓練資料數量不足，即便最大的人類評估資料集WMT Metrics Task，新聞領域也只有26萬筆人工評估，而這不足以訓練出進階的自然語言生成系統評估指標，為了解決這個問題，Google採用轉移學習，應用BERT的上下文單詞表示法，這是一種用於語言理解的最新非監督式表示學習法，另外，Google還使用了先進的預訓練方法，以提高BLEURT強健性。

之所以BLEURT的效能可以這麼好，就是因為使用預訓練技術，Google解釋，在使用人類評估資料微調之前，先使用數百萬個合成句對為模型預熱，研究人員使用維基百科上的句子，應用隨機擾動技術產生訓練資料，由於不使用人工評估，而是使用指標和模型集合，因此能以低成本但極大程度擴大訓練範例的數量。

經實驗證實，預訓練確實提高了BLEURT準確性，而Google對BLEURT進行了兩次預訓練，一次針對語言建模目標，另一次針對一系列自然語言生成評估目標，最後才使用WMT指標資料集進行微調。

Google對BLEURT進行了基準測試，結果證實BLEURT效能良好，包括在機器翻譯和資料生成文字等任務都超越現有的方法，比應用WMT Metrics Shared Task的BLEU，人工評估分數還要高48％。

取得連結
Facebook
X
Pinterest
以電子郵件傳送
其他應用程式

標籤： AI & Big Data 技術筆記 NLP（自然語言處理）

留言

張貼留言

技術提供：Blogger

主題圖片來源：hatman12

Tommas Huang

封存

9月 20257
12月 20241
11月 20241
10月 20241
9月 20243
8月 20241
11月 20232
8月 20231
3月 20239
2月 20235

顯示更多顯示較少

標籤

5G/6G 技術筆記2
心情分享3
手機維護筆記1
行銷免費網路資源2
求生密技2
知識圖譜筆記2
金融科技技術筆記25
時事焦點筆記5
區塊鏈 (Blockchain)15
國立中正大學雲端計算與物聯網數位學習碩士研究所 106-2 無線區域網路2

國立中正大學雲端計算與物聯網數位學習碩士研究所 106-2 雲端計算2
國立台灣大學資訊工程系所推廣教育中心證書1
推薦系統筆記1
深度學習 Deep Learning 筆記30
視訊軟體筆記1
創新創業筆記6
報稅步驟SOP懶人包3
智慧交通筆記1
智慧零售6
智慧醫療172
程式開發1
量子開發技術筆記1
量子電腦 Quantum computer5
雲端 Cloud - Docker 自動化部署輕量化的虛擬機8
雲端 Cloud - Kubernetes 自動化部屬輕量化的虛擬機1
雲端 Cloud 技術筆記27
雲端作業系統 Cloud OpenStack OS5
雲端儲存 Cloud Storage 筆記1
微軟 Azure 地圖服務1
搜尋引擎筆記1
資料庫 DB 筆記3
資料視覺化筆記1
資料結構 Data Structure1
資訊安全 Information security19
電子商務筆記9
電動車/交通科技技術筆記1
電腦網路 Computer Network 筆記15
演算法2
網站開發語言 Web development language3
網路小技巧7
網路安全 Network Security15
網路儲存伺服器Network Attached Storage 筆記1
論文AI工具技術筆記1
遷移學習技術筆記1
機器學習 (Machine Learning) 筆記70
職場工作術筆記1
霧端計算 Fog Computing1
AI - 人工智慧工作站4
AI & Big Data 技術筆記213
Ansible Builder IT 自動化工具筆記1
Apache Spark 大數據運算平台筆記3
Apple 維修教學技巧2
Apple iOS & macOS Cryptographic Services Documentation 文件1
AR/VR/MR 筆記1
Auto Machine Learing 技術筆記1
Bosque Programming Language 筆記1
C/C++ 程式設計技巧筆記3
Coursera 證書10
DevOps自動化工具筆記2
edx 證書1
Firefox 瀏覽器技巧1
Fuzzer 模糊筆記1
Git 技術筆記1
GitHub 筆記11
GitLab 技術筆記1
Google 表單筆記1
Google 證書1
Google Android 技術筆記8
Google Chrome 技術筆記1
Google Chrome 擴充功能技巧筆記11
Google Cloud Drive 筆記4
Google Data Analytics 技術筆記2
Google Dataset Search 筆記1
Google G Suite 技巧筆記2
Google Gmail 技巧筆記2
Google Lens 筆記1
Google Map 筆記6
Google Meet 筆記1
Google Play App 筆記2
Google Tensorflow 技術筆記10
Google YouTuber 小技巧3
Hadoop 大數據運算平台筆記1
IEEE Paper1
iOS 小技巧筆記5
IoT - 物聯網筆記12
LINE 技巧筆記42
Line Bot 筆記1
Linux - Ubuntu OS 技巧15
Linux OS 作業系統3
macOS X - Terminal 指令12
macOSX - Troubleshoot 技巧51
Microsoft .Net 技術筆記3
Microsoft Authenticator 保護帳戶安全筆記1
Microsoft Azure 雲端筆記5
Microsoft Forms 線上表單筆記1
Microsoft Office for Windows 10 技術筆記9
Microsoft Office for Windows 11 技術筆記1
Microsoft Power Shell Script 筆記2
Microsoft Teams 技術筆記8
Microsoft Virtual Studio 筆記1
Microsoft Visual Studio 技術筆記1
Microsoft Windows 10 技巧52
Microsoft Windows 11 技巧10
MicrosoftPower Platform 自動化筆記1
Micrsoft Edge 技術筆記1
mining massive dataset1
ML/DL 特徵工程技術筆記1
MySQL 技術筆記2
NB-IoT 技術筆記1
NLP（自然語言處理）11
Office 2016 for mac 技巧2
Oracle VM VirtualBox 技術筆記2
PCIe - HW 技術筆記1
Python - Data Science 學習筆記32
Python 程式筆記18
QA — Automation Engineer 筆記1
RAID 磁碟陣列筆記1
RFID 技術筆記1
RPA 流程自動化機器人筆記8
Samsung Pay 技巧1
Scrum 敏捷框架筆記2
SQL Database 筆記4
Telegram 通訊軟體技巧3
UEFI 技術筆記2
We Programming - AJAX1
Web Programming - PHP4
Web Programming - React 技術筆記1
WinDebug 技巧筆記2

顯示更多顯示較少

檢舉濫用情形