自然語(yǔ)言界面:開(kāi)啟人機(jī)交互的全新篇章

2024-1-5    博博

作者:山中

人機(jī)交互界面經(jīng)過(guò)幾十年的發(fā)展,人與機(jī)器間的交互變得越來(lái)越容易,隨著ChatGPT等大語(yǔ)言模型的出現(xiàn),一種我們既熟悉又陌生的交互方式再次進(jìn)入大眾視野,它就是自然語(yǔ)言界面(NLI)。

那么什么是自然語(yǔ)言界面,它又會(huì)為人機(jī)交互帶來(lái)哪些新的變化,它會(huì)成為下一代主流的用戶界面嗎?本文將從計(jì)算機(jī)UI的發(fā)展簡(jiǎn)史出發(fā),對(duì)比自然語(yǔ)言界面與傳統(tǒng)圖形界面的差異,帶你了解自然語(yǔ)言界面的應(yīng)用場(chǎng)景和發(fā)展方向。

一、計(jì)算機(jī)UI發(fā)展簡(jiǎn)史

首先讓我們回顧一下過(guò)去幾十年計(jì)算機(jī)UI的發(fā)展階段。

1、穿孔紙帶(Punched tape)

1940-1960年代,早期的計(jì)算機(jī)通過(guò)穿孔紙向計(jì)算機(jī)輸入指令,帶孔為1,無(wú)孔為0,經(jīng)過(guò)光電輸入機(jī)將數(shù)據(jù)輸入計(jì)算機(jī)。由于需要輸入二進(jìn)制的機(jī)器語(yǔ)言,計(jì)算機(jī)在這個(gè)階段只被少數(shù)專家應(yīng)用于專業(yè)領(lǐng)域。

 

2、命令行界面(CLI)

20世紀(jì)60年代中期,命令行界面( CLI )作為穿孔紙帶的友好替代方案出現(xiàn)在計(jì)算機(jī)上。命令行界面是一種通過(guò)輸入被稱為命令行的文本行與計(jì)算機(jī)程序交互的方法,雖然它與人類(lèi)語(yǔ)言有較大差異,但還是大幅降低了計(jì)算機(jī)的使用門(mén)檻,個(gè)人計(jì)算機(jī)(PC)隨之出現(xiàn)。

 

3、圖形用戶界面(GUI)

命令行界面通常需要用戶記憶操作的命令,這對(duì)于普通用戶仍然是很困難的。GUI的出現(xiàn)正是為了解決這個(gè)問(wèn)題:既然人類(lèi)很難記住各種命令,那就讓機(jī)器提供可能的選項(xiàng),人類(lèi)只需要通過(guò)圖形元素進(jìn)行選擇。最早的圖像界面出現(xiàn)在1970年代,隨后蘋(píng)果和微軟讓GUI普及,短短二三十年,使用GUI交互的計(jì)算機(jī)和各類(lèi)消費(fèi)電子產(chǎn)品已經(jīng)成為我們工作生活中不可缺少的一部分。

 

 

二、自然語(yǔ)言界面(NLI)的爆發(fā)

什么是自然語(yǔ)言界面?

W3C是這樣定義的:自然語(yǔ)言界面是用戶與系統(tǒng)通過(guò)自然語(yǔ)言進(jìn)行通信的用戶界面。用戶通過(guò)語(yǔ)音或某種其他方法提供輸入,并且系統(tǒng)以通過(guò)語(yǔ)音、文本或某種其他方法傳遞的話語(yǔ)的形式生成響應(yīng)。

自然語(yǔ)言界面是什么時(shí)候出現(xiàn)的?

最早的自然語(yǔ)言界面可以追溯到 20 世紀(jì) 60 年代。ELIZA是一個(gè)早期的自然語(yǔ)言處理計(jì)算機(jī)程序,由麻省理工學(xué)院的Joseph Weizenbaum教授于1964 年至 1967 年開(kāi)發(fā),旨在探索人類(lèi)和機(jī)器之間的溝通方法。ELIZA 通過(guò)模式匹配和替換來(lái)模擬對(duì)話,也就是說(shuō)它通過(guò)檢測(cè)用戶輸入的內(nèi)容中是否包含某些關(guān)鍵詞來(lái)做出響應(yīng),雖然它能做出的反應(yīng)有限,更不能真正理解人類(lèi)的語(yǔ)言,但這是人類(lèi)第一次嘗試通過(guò)自然語(yǔ)言進(jìn)行人機(jī)交互,也是后續(xù)自然語(yǔ)言處理(NLP)技術(shù)研究的一個(gè)里程碑。

 

語(yǔ)音用戶界面(VUI)

自然語(yǔ)言處理(NLP)技術(shù)經(jīng)過(guò)幾十年的發(fā)展,終于在2010年代迎來(lái)第一波應(yīng)用爆發(fā)。2011年 Siri 作為 iOS 功能由 Apple 發(fā)布,隨后各家手機(jī)語(yǔ)音助手、智能音箱等VUI產(chǎn)品紛紛出現(xiàn)。但隨之出現(xiàn)了一個(gè)新的網(wǎng)絡(luò)名詞-“人工智障”。雖然 Siri 相比 ELIZA 能做的事情更多了,但它們?cè)隗w驗(yàn)上仍沒(méi)有本質(zhì)區(qū)別,Siri等產(chǎn)品依然需要用戶遵循特定的表述方式才能做出正確響應(yīng),可能換一個(gè)表述方式它們就聽(tīng)不懂了,所以這個(gè)階段的自然語(yǔ)言界面更多是作為一種輔助交互方式

 

大語(yǔ)言模型(LLM)

ChatGPT 于2022年底開(kāi)放測(cè)試,不到一年時(shí)間大語(yǔ)言模型(LLM)與AIGC應(yīng)用已經(jīng)遍地開(kāi)花。大語(yǔ)言模型實(shí)現(xiàn)了NLP技術(shù)的階段性跨越,AI對(duì)自然語(yǔ)言的理解能力大幅提升,不僅能模仿人類(lèi)對(duì)話,還具備文案寫(xiě)作和問(wèn)題分析等能力,并且這些能力還在飛速進(jìn)步中,相信自然語(yǔ)言界面即將迎來(lái)第二次應(yīng)用爆發(fā)。

 

三、自然語(yǔ)言界面的優(yōu)勢(shì)

那么,自然語(yǔ)言界面相比傳統(tǒng)圖形界面又有什么優(yōu)勢(shì)呢?

1、低門(mén)檻

刻在我們DNA里的交互方式

語(yǔ)言是我們與他人交互的主要“界面”,智人的言語(yǔ)出現(xiàn)于 50,000 至 200 萬(wàn)年前,所以說(shuō)這是刻在我們DNA里的交互方式。我們從小就學(xué)習(xí)閱讀、寫(xiě)作和說(shuō)話,因此通過(guò)自然語(yǔ)言界面與計(jì)算機(jī)交互幾乎不需要學(xué)習(xí)。

 

2、高效率

GUI的思路是機(jī)器提供可能的選項(xiàng),讓人類(lèi)進(jìn)行選擇。但復(fù)雜產(chǎn)品可能有幾百上千個(gè)選項(xiàng),即便設(shè)計(jì)師努力按照最合理的邏輯整理、收納這些選項(xiàng),用戶仍需要花大量時(shí)間精力尋找、理解、記憶這些選項(xiàng)。

酷家樂(lè)用戶問(wèn)題

酷家樂(lè)用戶聯(lián)系客服的問(wèn)題中較多是工具使用問(wèn)題:怎么添加門(mén)把手、怎么把門(mén)翻轉(zhuǎn)、怎么顯示柜體尺寸。在幾十上百個(gè)功能中找到那一個(gè)功能都如此困難,對(duì)于需要用到多個(gè)“選項(xiàng)”組合操作才能實(shí)現(xiàn)的效果,那確實(shí)難以要求普通用戶做到。

 

但如果酷家樂(lè)支持自然語(yǔ)言交互,我只需要告訴它我們的訴求:“添加門(mén)把手”、“把門(mén)翻轉(zhuǎn)”、”顯示柜體尺寸“,軟件便會(huì)直接實(shí)現(xiàn)這些的效果。

通過(guò)自然語(yǔ)言輸入,用戶便可以忘記各家軟件各種復(fù)雜的交互邏輯,設(shè)計(jì)師也無(wú)需煞費(fèi)苦心設(shè)計(jì)復(fù)雜的用戶引導(dǎo)和幫助系統(tǒng),隨之客服人力成本也將大幅降低。

Tome

目前已經(jīng)有一些產(chǎn)品在這么做了,Tome是一款制作提案PPT的產(chǎn)品,它可以通過(guò)自然語(yǔ)言輸入實(shí)現(xiàn)大部分操作,并且支持AI直接生成內(nèi)容。

 

3、不設(shè)限

早期計(jì)算機(jī)的輸入輸出完全靠機(jī)器語(yǔ)言,門(mén)檻很高。后來(lái),普通用戶借助圖形界面和開(kāi)發(fā)好的程序,也能輕松使用計(jì)算機(jī),但同時(shí)我們也被其限制了。

美間站點(diǎn)

以”美間“為例,美間站點(diǎn)有大量的海報(bào)模板,可以按用途、風(fēng)格維度進(jìn)行篩選,但用戶也只能按這兩個(gè)維度篩選。如果我想找出10月份用戶點(diǎn)擊最高的10個(gè)節(jié)氣海報(bào)模板,那對(duì)不起,辦不到,不是因?yàn)槲覀儧](méi)有這個(gè)數(shù)據(jù),而是我們沒(méi)有提供個(gè)“選項(xiàng)”,通過(guò)SQL或者其他語(yǔ)言查詢數(shù)據(jù)庫(kù)就可以獲取到。

 

但如果美間的數(shù)據(jù)庫(kù)接入了大語(yǔ)言模型,那么直接問(wèn)它,就能得到任何數(shù)據(jù)庫(kù)能提供的內(nèi)容,因?yàn)楝F(xiàn)在LLM已經(jīng)會(huì)自己寫(xiě)代碼做數(shù)據(jù)分析工作了。通過(guò)自然語(yǔ)言界面,我們可以最大程度發(fā)揮計(jì)算機(jī)和數(shù)據(jù)庫(kù)的價(jià)值。

 

四、自然語(yǔ)言會(huì)不會(huì)取代圖形界面?

自然語(yǔ)言界面這么強(qiáng)大,那它會(huì)不會(huì)取代圖形界面呢?答案是不會(huì),受限于AI能力發(fā)展現(xiàn)狀和自然語(yǔ)言自身的局限性,自然語(yǔ)言界面有其適用范圍。

1、AI能力仍有限

理想情況是AI能完全理解我們的訴求、且能力能夠覆蓋,但現(xiàn)在還做不到。用戶隨便輸入一個(gè)需求,產(chǎn)品很可能做不到,這就需要我們通過(guò)GUI進(jìn)行提示和引導(dǎo)。

 

2、額外的處理時(shí)間

相比通過(guò)GUI直接對(duì)程序發(fā)出指令,用戶輸入自然語(yǔ)言LLM普遍需要幾秒鐘的處理時(shí)間,帶來(lái)更高的試錯(cuò)成本,某些場(chǎng)景下我們使用GUI操作更加快捷。

 

3、自然語(yǔ)言表達(dá)不夠精準(zhǔn)

人與人的交流也常常存在歧義,更別說(shuō)跟機(jī)器交流了,所以自然語(yǔ)言界面不適合做非常精細(xì)的操作。 

美間提案PPT

以美間提案PPT為例,如果我通過(guò)自然語(yǔ)言輸入:“把標(biāo)題改成紅色”,那AI可能會(huì)反問(wèn):”哪個(gè)標(biāo)題?哪種紅色?“。試想一下,如果要通過(guò)自然語(yǔ)言描述這些信息,是不是還不如通過(guò)鼠標(biāo)選擇來(lái)的簡(jiǎn)單。

 

4、自然語(yǔ)言輸入也存在成本

自然語(yǔ)言輸入,用戶需要把需求組織成語(yǔ)言,然后打字或講出。也就是說(shuō)用戶需要?jiǎng)幽X子,這顯然與我們追求的”Dot let me think“原則相違背

美間海報(bào)

以美間海報(bào)場(chǎng)景為例,美間支持”AI生成“和”模板再創(chuàng)作“兩種海報(bào)創(chuàng)作方式。這兩種方式分別有各自的使用場(chǎng)景。如果用戶需要一張?jiān)┳8:?bào),對(duì)于目標(biāo)明確的用戶,他可以通過(guò)詳細(xì)描述畫(huà)面需求,生成個(gè)性化的海報(bào)方案。例如:”生成一張?jiān)┕?jié)日海報(bào),主題為:群核科技祝您元旦快樂(lè),畫(huà)面要喜慶,插畫(huà)風(fēng)格,包含煙花、燈籠、熱鬧的人群等元素“

 

但對(duì)于更多用戶來(lái)說(shuō),描述一個(gè)海報(bào)畫(huà)面是困難的,大部分用戶只需要一個(gè)通用的模板改改字就足夠了,這樣不但更輕松,而且得到的海報(bào)質(zhì)量也更高。

 

五、NLI與GUI融合互補(bǔ)

所以,自然語(yǔ)言界面不會(huì)取代圖形界面,它們更多會(huì)融合互補(bǔ),在各自的擅長(zhǎng)領(lǐng)域發(fā)光發(fā)熱。

 

未來(lái)常見(jiàn)的用戶工作流將會(huì)是:NLI發(fā)散-GUI收斂,先使用NLI得到一個(gè)大概結(jié)果,再通過(guò)GUI完成確認(rèn)或調(diào)整。

美間AI海報(bào)

美間AI海報(bào)就是這樣的設(shè)計(jì)思路:基于自然語(yǔ)言輸入生成若干結(jié)果,選擇一個(gè)滿意的方案再二次編輯。

 

六、NLI還有哪些應(yīng)用場(chǎng)景?

自然語(yǔ)言界面還有哪些應(yīng)用場(chǎng)景?微軟表示:萬(wàn)物皆可“Copilot”。

Copilot是微軟發(fā)布的依托于大語(yǔ)音模型的AI助手(AI Agent)。11月15日的微軟Ignite大會(huì)上,CEO納德拉向我們展示了Copilot最新的形態(tài):一個(gè)入口連接無(wú)限可能。

Copilot可以連接各種應(yīng)用和數(shù)據(jù)源,用戶只需要把需求告訴Copilot,Copilot就能自動(dòng)完成全部應(yīng)用和數(shù)據(jù)操作,甚至是跨應(yīng)用和跨數(shù)據(jù)源的。

Copilot Studio

Copilot Studio是微軟面向B端用戶推出的AI助手,支持用戶自定義專屬的Copilot,以滿足行業(yè)、部門(mén)、角色等內(nèi)外部場(chǎng)景的定制化需求。讓Copilot鏈接企業(yè)財(cái)務(wù)系統(tǒng),你可以隨時(shí)問(wèn)它各類(lèi)財(cái)務(wù)預(yù)算的開(kāi)支和剩余情況;Copilot還能雙向打通CRM、ERP等SAAS產(chǎn)品,自動(dòng)化執(zhí)行復(fù)雜的業(yè)務(wù)流程,比如辦理新員工入職、費(fèi)用報(bào)銷(xiāo)等。

 

數(shù)據(jù)分析

Excel擁有強(qiáng)大的數(shù)據(jù)分析能力,但我們大部分人只用過(guò)Excel來(lái)制作表格,因?yàn)楦唠A的函數(shù)、宏等功能對(duì)于普通用戶來(lái)說(shuō)學(xué)習(xí)成本太高?,F(xiàn)在,Copilot與Excel結(jié)合,便可以實(shí)現(xiàn)通過(guò)自然語(yǔ)言寫(xiě)代碼執(zhí)行復(fù)雜的數(shù)據(jù)分析工作。

 

AIGC

AIGC是當(dāng)前最熱門(mén)的AI應(yīng)用領(lǐng)域之一,除了常見(jiàn)的文案生成、圖片生成,傳統(tǒng)的內(nèi)容創(chuàng)作軟件結(jié)合AIGC能力也可以發(fā)揮出巨大的潛力。Copilot加持下的PPT,只需一句話,Copilot將自動(dòng)幫你完成PPT的文案、配圖、排版等工作。

 

七、展望

未來(lái)自然語(yǔ)言界面將重塑現(xiàn)有產(chǎn)品的交互方式, 但自然語(yǔ)言也只是一種交互方式,未來(lái)隨著AI能力和硬件技術(shù)的發(fā)展,人類(lèi)與機(jī)器間的交互成本還將進(jìn)一步降低。

微軟在Ignite大會(huì)上演示了未來(lái) AI+MR 設(shè)備的應(yīng)用場(chǎng)景,借助MR設(shè)備AI可以看到、聽(tīng)到、解釋、理解我們的意圖和我們周?chē)氖澜?,我們只需要極少的輸入就能得到需要的結(jié)果。以現(xiàn)在AI技術(shù)的發(fā)展速度,相信這些看似科幻電影中的場(chǎng)景用不了多久便會(huì)成為現(xiàn)實(shí)。

藍(lán)藍(lán)設(shè)計(jì)(www.bouu.cn )是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國(guó)內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計(jì)、B端界面設(shè)計(jì)、桌面端界面設(shè)計(jì)APP界面設(shè)計(jì)、圖標(biāo)定制用戶體驗(yàn)設(shè)計(jì)、交互設(shè)計(jì)、UI咨詢、高端網(wǎng)站設(shè)計(jì)、平面設(shè)計(jì),以及相關(guān)的軟件開(kāi)發(fā)服務(wù),咨詢電話:01063334945。

關(guān)鍵詞:UI咨詢UI設(shè)計(jì)服務(wù)公司軟件界面設(shè)計(jì)公司、界面設(shè)計(jì)公司、UI設(shè)計(jì)公司UI交互設(shè)計(jì)公司、數(shù)據(jù)可視化設(shè)計(jì)公司、用戶體驗(yàn)公司、高端網(wǎng)站設(shè)計(jì)公司

銀行金融軟件UI界面設(shè)計(jì)、能源及監(jiān)控軟件UI界面設(shè)計(jì)、氣象行業(yè)UI界面設(shè)計(jì)軌道交通界面設(shè)計(jì)、地理信息系統(tǒng)GIS UI界面設(shè)計(jì)、航天軍工軟件UI界面設(shè)計(jì)、醫(yī)療行業(yè)軟件UI界面設(shè)計(jì)、教育行業(yè)軟件UI界面設(shè)計(jì)、企業(yè)信息化UI界面設(shè)計(jì)、軟件qt開(kāi)發(fā)軟件wpf開(kāi)發(fā)、軟件vue開(kāi)發(fā)

 

分享本文至:

日歷

鏈接

個(gè)人資料

存檔