二吊插入一穴一区二区_神马亚洲视频_日本中文字幕视频_国产欧美一区二区三区精品酒店_窝窝社区一区二区_亚洲综合色站_久久xxxx_综合久久综合久久

如何評測一個智能對話系統(一)

放大字體  縮小字體 發布日期:2019-11-24  來源:來自互聯網  作者:來自互聯網  瀏覽次數:590
導讀

然而,智能對話系統的表現往往因不同的應用場景和目標而異,因此行業內一直都沒有一個統一的對話質量評測標準。無論對話內容是否有明確的話題和意圖,我們都應該關注其傳達的信息和情感。當明確了評判條件以后,我們就能給…

本文從對話系統的分類介紹與評測目標進行分析,解釋了如何評測一個智能對話系統。

本文從對話系統的分類介紹與評測目標進行分析,解釋了如何評測一個智能對話系統。

自然語言對話作為新一代的人機交互媒介,已經創建了廣泛的應用程序。長期以來,研究人員一直在探索機器產生自然回復的不同方法,包括基于檢索的回復,端到端的生成回復,以及問答和推薦系統。 從智能家居設備到智能電話助手,從客戶服務到情感陪伴,我們周圍已經出現了各式各樣的聊天機器人。 然而,智能對話系統的表現往往因不同的應用場景和目標而異,因此行業內一直都沒有一個統一的對話質量評測標準。

近年來,“如何評測一個智能對話系統”這個開放的問題引起了相關領域研究人員的極大關注。在過去的幾年時間里,我一直致力于探索智能對話系統的評測方法。由我設計的對話評測方法已經在多款智能對話產品上得到驗證,有效推動了產品的持續優化和迭代。與此同時,該評測方法被nlpcc2019選為開放域對話系統競賽的評測標準,受到了領域專家的認可。

那么,對于這樣一個看似無解的問題,我是如何著手進行設計的呢?

首先,對話評測是一個非常大的概念,它涉及到很多不同領域的知識,而且非常的主觀,無法用一個統一的標準評判。說白了,這個問題就是在評價一個人說話的水平,只不過被評價的對象是一個機器人。不過,這個事情也不是完全無章可循。我們可以通過聚焦和拆解的方法把這個大問題分成多個可量化的小問題。

事實上,想要有效的評測一個對話系統,我們首先要知道被評測對話系統的目標是什么。換句話說,就是我們期待對話系統給我們帶來什么樣的價值。只要明確了目標,我們就可以圍繞目標建立標準,再通過標準沿伸出評測的方法。

智能對話系統的分類

談到對話系統的目標,就不得不提及對話系統的分類。一般來說,人機交互的對話場景一共分為三大類別,分別是任務類對話,問答類對話,和閑聊類對話。這是目前業界比較公認的方法,其依據是這三類對話系統背后所運用到的核心技術與實現方法截然不同。

不過,在真實的應用場景中,幾乎每款對話類產品都同時具備了上述提到的至少兩類對話系統的特征。目前市面上的對話系統往往同時具備解決任務的能力,回答問題的能力和閑聊的能力。因此我們不能單純的以這樣的分類方式為對話系統分別設計評測方法,而是跳出技術的實現框架,從應用的角度尋找所有智能對話系統共同存在的特征,并以這些特征作為考量條件去設計評測方法。我將這些特征總結為話系統的對話情境,對話場景以及對話目的。

智能對話評測的考量條件 對話情境-上下文內容

在對話系統中,回答內容的好壞與上文的內容有著直接的關聯,在評價回答內容的時候,最主要的一個限制條件就是上文問題的內容。在評判一個對話系統生成答案好與壞的時候,測試者需要結合上文的內容才能對答案作出比較公正和正確的判斷。這當中不僅需要判斷當前對話內容的質量,還涉及到對話所表達內容邏輯的一致性與情感的合理性。上下文內容對于多輪對話的生成起著至關重要的影響。一組對話內容被放在不同的對話情境下會表現出皆然不同的效果。因此,在對一組對話內容進行評測時,有必要充分理解其所在的對話情境。

對話場景 – 機器人扮演的角色

在不同的應用場景下,對話系統需要扮演不同的角色以實現用戶特定的需求和意愿。目前比較主流的應用場景包括家庭場景,早教場景,客服場景和車載場景。一個特定的場景下的對話內容,總是包含特定的術語或套路,以及相關領域的知識庫或知識圖譜。這一類的對話往往可以返回一些約定俗成的回答或解決方案。在對對話系統進行判定之前,測試人需要通過想象力將自己置身于該場景中。理解對話系統所嘗試扮演的角色,能夠幫助我們更加客觀的對其進行評測。

對話目的 – 話題與意圖

在現實生活中,人與人的自然語言對話可分為兩大類,即有目的的對話和無目的的對話。有目的的對話可以根據提問者或主動發起對話者來引導當前對話的目的。在對話結束時,我們可以通過判斷目是否達成而判斷對話的質量。然而,在實際對話過程中,對話的目的并不總是能夠被清晰的定義。在對話評測時,我們不能只關心有明確目的的對話,而忽略無目的的對話。在無目的的對話內容中依然會有信息的傳遞,和情感的交互。因此,無論對話內容是否有明確的話題和意圖,我們都應該關注其傳達的信息和情感。

對話系統的評測目標

這些對話系統通用的考量條件,就是我們評判一個智能對話系統的先覺條件。當明確了評判條件以后,我們就能給一組好的對話內容進行定義,以此來對一個智能對話系統進行評測。

首先好的對話內容應該是符合語義情境的,上下文內容應該是緊密關聯的,并且是邏輯自洽的。接下來,好的對話內容應該可以滿足特定的應用場景,對話的內容表達是清晰明確的,同時切合用戶期待的。最后,無論話題是開放領域還是垂直領域的,無論意圖是達成還是未達成,好的對話內容都應該是具備的信息和情感的。

總結

至此,我們把如何評價一個智能對話系統的問題轉化如何定義一個好的智能對話系統,并通過實際對話類產品在真實場景中的應用情況,歸納出對話評測系統的考量條件與標準尺度。有了明確的尺度,智能對話評測的具體任務設計也就變得有章可循了。

一般來說,對話評估的工作主要從兩個方面進行處理:自動評估和人工評估。我將在下一篇文章中介紹當前主流的自動機器對話評測任務,和人工標注方法。我將分析這些任務和方法的不足之處,并闡述我自己是如何結合自動評測與人工標注來設計智能對話評測方法的。

本文由 @單師傅 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash ,基于 CC0 協議

 
 
免責聲明
本文為會員免費發布,僅代表發布者個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,作者需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理。
 
 
久草在线在线精品观看| 久操精品在线| 交视频在线观看国产| 国产精品国产三级国产有无不卡| 国产一区二区亚洲| 欧美日本高清| 欧美午夜在线观看| 美女脱光内衣内裤视频久久网站| 57pao成人永久免费| 草久在线视频| 精品久久久久久久久中文字幕| 噜噜噜在线观看免费视频日韩| 91精品国产经典在线观看| 亚洲人成绝费网站色www| 国产精品久久久久久妇女6080| 欧美激情第10页| 天堂网在线最新版www中文网| 亚洲精品乱码久久久久久金桔影视| 久久免费电影网| 亚洲老妇激情| 在线最新版中文在线| 91p在线观看| 亚洲最大成人网4388xx| 久久久精品五月天| 国内露脸中年夫妇交换精品| youjizz在线播放| 欧美精品一二三区| 91毛片在线观看| 女主播福利一区| 中文在线免费二区三区| 日本五十路在线| 色乱码一区二区三区88| 成人一道本在线| 日本久久一二三四| 成人勉费视频| 小草av在线播放| 欧美精品第1页| 国产欧美视频一区二区三区| 91久久午夜| 国产精品白丝av嫩草影院| 老司机福利在线视频| 日韩激情视频在线| 亚洲成a人在线观看| 国产iv一区二区三区| 亚洲精品va| 日韩专区视频| 日韩精品毛片| 亚洲老头老太hd| 欧美午夜精品伦理| 久久亚洲二区三区| 噜噜噜久久亚洲精品国产品小说| 欧美成人一区在线观看| 18video性欧美19sex高清| 草莓污污视频在线观看| 欧美视频一区二区在线观看| 久久久久久久精| 久久亚洲精选| 欧美限制电影| 高清欧美日韩| 成人免费一区二区三区视频网站| 精品国产精品一区二区夜夜嗨| 亚洲黄色录像片| 成人动漫一区二区| 午夜影院日韩| 日韩88av| 欧美影院在线| 77thz桃花论族在线观看| 香蕉国产在线| 日韩av最新在线| 欧美在线免费播放| 亚洲欧洲www| 成人av一区二区三区| 亚洲一区成人| 91亚洲国产高清| 1204国产成人精品视频| 在线免费看h| 免费在线观看av片| 超碰在线免费| 日韩av一区在线| 欧美日韩视频专区在线播放| 亚洲色图在线看| 91丝袜美腿高跟国产极品老师| 久久这里只有| 国产网站一区二区| 日韩一区二区不卡| 99久久99久久精品免费观看| 每日更新成人在线视频| 999成人精品视频线3| 高潮久久久久久久久久久久久久| 伊人久久av| 在线观看中文字幕的网站| 一个人免费观看视频www在线播放 一个人免费视频www在线观看 | 欧美国产一区二区| 成人免费视频国产在线观看| 免费欧美在线视频| 国产欧美日韩亚洲一区二区三区| 日韩久久视频| 网友自拍区视频精品| 麻豆一区在线| 国产成人精品亚洲日本在线观看| 污污的网站在线看| 视频三区在线| 成人在线免费观看| 日本精品专区| 亚洲天堂2017| 两个人hd高清在线观看| 国产夫妻在线视频| 亚洲欧美日韩一区在线| 欧美精品一区二区三区一线天视频| 欧美人妖巨大在线| 在线免费精品视频| 日韩欧美主播在线| 精品人伦一区二区三区蜜桃免费| 一区二区三区在线高清| 亚洲欧美在线视频观看| 国产精品伦一区| 国产精品网站在线观看| 国产午夜精品一区二区 | 91小视频免费观看| 成人丝袜18视频在线观看| 国产精品一区二区在线播放| 久国产精品韩国三级视频| 美美哒免费高清在线观看视频一区二区 | 色呦呦在线视频| 在线视频国产区| 国产精品久久久久久福利| 免费超碰在线| www在线观看播放免费视频日本| 人人干在线视频| 成人黄色在线电影| 丁香花在线观看完整版电影| 丰乳肥臀在线| 日韩三级影视| 成人免费在线观看视频| 四虎国产精品永久在线国在线| 精品美女一区| 美女精品久久| 精品久久对白| 自拍偷拍精品| 98精品视频| 亚洲精品一二| 日韩国产在线观看一区| 久久99精品久久久久久久久久久久| 久久99精品久久久久久久久久久久| 国产最新精品免费| 国产成人亚洲综合a∨猫咪| jvid福利写真一区二区三区| 久久网站最新地址| 中文字幕在线免费不卡| 亚洲一级二级三级在线免费观看| 精品久久久一区二区| 欧亚一区二区三区| 日韩精品一区二区三区三区免费| 欧美精品一区二区精品网| 亚洲视频电影图片偷拍一区| 领导边摸边吃奶边做爽在线观看| 可以在线观看的av| 91在线中文| 精品免费av在线| 麻豆国产一区二区三区四区| 亚州av日韩av| 欧美国产三区| 日韩激情中文字幕| 国产成人午夜片在线观看高清观看| a在线欧美一区| 亚洲视频一区二区在线| 欧美香蕉大胸在线视频观看| 欧美欧美午夜aⅴ在线观看| 亚洲丁香婷深爱综合| 国产网站av| 在线免费观看黄| 在线最新版中文在线| 91国内精品| 2023国产精品久久久精品双| 亚洲性色视频| 六月丁香婷婷色狠狠久久| 国产精品一区二区视频| 欧美韩国日本综合| 有码一区二区三区| 在线一区二区三区做爰视频网站| 精品三级av在线| 992tv在线观看免费进| 老司机av在线免费看| 国产欧美自拍| 成人免费在线观看av| 欧美一区=区| 久久综合色播五月| 午夜久久久久久久久久一区二区| 69堂精品视频| 超碰在线12| 草草视频在线| 久9re热视频这里只有精品| 国产综合自拍| 丰满岳乱妇一区二区三区| 一区二区三区产品免费精品久久75| 欧美精品丝袜中出| 一级毛片在线视频| 人狥杂交一区欧美二区| 欧美午夜18电影| 久久国产福利|