在商業(yè)環(huán)境中的UX體驗衡量指標

2019-7-24    資深UI設(shè)計者

如果您想訂閱本博客內(nèi)容,每天自動發(fā)到您的郵箱中, 請點這里

好的衡量指標帶你上天堂,不好的衡量指標帶你睡…

嗨,本周Nathan 與大家分享下一些在UX 工作中,常會聽到的一些衡量指標專有名詞,有些或許是你常常聽到但不太確定的,有些則可能是你所在的領(lǐng)域或項目比較少討論的。

雖然在大多數(shù)的公司中,與中小型的設(shè)計團隊,采用快速定性的研究,可能是比較符合CP 值的方式。但當(dāng)產(chǎn)品、用戶甚至團隊具有一定規(guī)模時,關(guān)于量化指標的重要性,在2019 年的今天想必已經(jīng)不需要再重復(fù)敘述。

不太一樣或是常被誤會的是,對于設(shè)計師來說,多數(shù)在工作中使用的量化衡量指標,其實大多是圍繞設(shè)計工作的顯性部分,也就是可用性(Usability) 上,而可用性工作其實只是UX Design 的一環(huán)。

但, UX 畢竟是由商業(yè)環(huán)境中反推學(xué)術(shù)的一門職位。

如果僅僅只是將量化指標用在UX Designer 的工作上,反而是自己自廢武功。不要忘記小至前端展現(xiàn),大至商業(yè)策略,都可以是UX Design 的范圍。

Five Levels of UXs ConversionXL

因此如何學(xué)習(xí)使用一些既帶有商業(yè)特性,又能體現(xiàn)用戶體驗的指標,是每個UX 工作者,多少都要知道的。

We are not design the UX,but we can design for UX

另外,本篇主要在分享一些使用體驗橫標指標上的一些迷思,與介紹工作中常用的一些指標,至于如何透過這些指標幫助UX Designer 在工作中提升重要性,來自證UX 工作能帶來的價值部分,可以看一下Nathan 以前寫過的一篇古早文。

 

1、關(guān)于數(shù)據(jù)指標與衡量的常見迷思

01 數(shù)據(jù)指標的使用,不符合GSM 原則

當(dāng)有一定的用戶后,結(jié)合常見的數(shù)據(jù)分析工具或內(nèi)部團隊自建的數(shù)據(jù)埋點,網(wǎng)站和應(yīng)用馬上就能出現(xiàn)許多可供分析的數(shù)據(jù),似乎只要有這些數(shù)據(jù),令人驚喜的洞察就會自動浮出水面。

GSM(Goal-Signal-Metrics)是Google 提出的目標導(dǎo)向衡量模型,用來拆解用戶使用產(chǎn)品時的設(shè)計目標-行為信號-衡量指標的一種模式。

Google GSM Framework, Goal-Signal-Metrics

在商業(yè)場景中,所有的數(shù)據(jù)衡量必定帶有明確的目標,比如:透過觀察寬口轉(zhuǎn)化和窄口轉(zhuǎn)化,分析廣告投放效益以及GMV 成本。甚至,如果僅基于這些觀察數(shù)據(jù)進行動作性的優(yōu)化,沒有配合中長期的決策時,變化僅會流于短期效益。

02 顯而易見的數(shù)據(jù)指標,不代表就是有幫助的

一個數(shù)據(jù)指標容易監(jiān)測與計算,并不意味著它對你的產(chǎn)品來說就是重要的。透過現(xiàn)在大部分的分析工具,可以很容易就監(jiān)測跟蹤成百上千的各種指標,而且分析的工具也層出不窮。新產(chǎn)品團隊往往因為能獲取大量的數(shù)據(jù),然后就期望洞察自動出現(xiàn),但往往不遂人意。

例如,網(wǎng)頁或App 的PV 數(shù)據(jù)很容易收集,但如果你的網(wǎng)頁或產(chǎn)品是屬于內(nèi)容消費類型的,它就無法呈現(xiàn)用戶是否在你的網(wǎng)站消費內(nèi)容(有效時長更具代表性)。高的PV 或許是由市場廣告轉(zhuǎn)化過來的用戶,但對內(nèi)容消費類的產(chǎn)品目標,肯定不是確定每個用戶到底瀏覽了多少頁面,PV 可能是衡量廣告效果的重要度量,但它并不是監(jiān)測用戶參與度的良好方式。

如果你不確定你正在用的數(shù)據(jù)指標,是否有正向幫助的話??梢詤⒖糀ARRR 的轉(zhuǎn)化模型,來幫助自己梳理清楚核心的轉(zhuǎn)化鏈路。

03 單一的數(shù)據(jù)指標,對于效果衡量可能是模糊的

如上面所說相較于PV、UV、DAU,用戶在網(wǎng)站或應(yīng)用中的有效停留時長,可能更適合用來衡量用戶在產(chǎn)品中的參與度。

但停留時間越長可能是正面的,也可能是負面的。在電商產(chǎn)品類的轉(zhuǎn)化過程中,如果在關(guān)鍵的轉(zhuǎn)化節(jié)點用戶停留較久,可能意味著用戶因困惑、分心或挫敗而花費了大量時間。即便同時監(jiān)測網(wǎng)站或應(yīng)用的停留時長和轉(zhuǎn)化率,你可能仍然不清楚為什么用戶參與度如此高,對于最后的成交卻沒有太大幫助。

這時就需要透過配合更細致的數(shù)據(jù)指標組合,慢慢的定位用戶在操作步驟中的關(guān)鍵問題,并嘗試透過A/B Testing 來解決。

04 正確的衡量指標,要依產(chǎn)品、企業(yè)本身而制定

大家常用的數(shù)據(jù)指標,并不一定適合自己當(dāng)前產(chǎn)品階段或企業(yè)目標。

正常而言企業(yè)的主力產(chǎn)品,正是代表著企業(yè)主要的商業(yè)營利模式,因此在發(fā)布產(chǎn)品后要監(jiān)測的各種衡量指標,通常在產(chǎn)品準備進入市場前,都已依照商業(yè)模式進行拆分。但在產(chǎn)品的冷啟動時期,這些依商業(yè)模式拆分的指標,很多時候無法反映出,企業(yè)的產(chǎn)品是否正在往好的方向成長。

比如Saas服務(wù)類型的產(chǎn)品,通常都會使用凈收入留存NDRR (Net Dollar Retention Rate)作為主要的商業(yè)模式指標,但在前期用戶量少時,搭配NPS或PSAT等類型的指標,才能夠好的回歸到Saas產(chǎn)品的服務(wù)體驗本質(zhì)。了解企業(yè)目前提供的服務(wù),對用戶來說是否是正向的,并且能持續(xù)增長。

05 大多時候,衡量指標并不會純粹與設(shè)計相關(guān)

在產(chǎn)品開發(fā)迭代中發(fā)布新功能后,數(shù)據(jù)可能會開始上升。產(chǎn)品團隊可能認為這是新功能的發(fā)布造成的,但銷售部分卻可能會將它與一項新的促銷活動聯(lián)系起來,而UX 團隊則可能認為這與他們的新設(shè)計相關(guān)。

這種場景在產(chǎn)品的數(shù)據(jù)到達一定規(guī)模時十分常見。真實情況是只能透過控制一些固定因子,來做更細部的A/B Testing 拆分。但大多時候產(chǎn)品的迭代時間與開發(fā)資源,很難真正做到能明確確認是因為什么原因。

因此結(jié)合前面所說的,各團隊在主要的數(shù)據(jù)指標中,配合其他輔助指標,甚至提取更與團隊緊密相關(guān)的個別指標,來了解在產(chǎn)品的迭代過程中,各自團隊做的決策是否是正向的。

用戶體驗指標,跟易用性和商業(yè)指標目的不同

下面就會介紹幾種工作中常用的,與體驗相關(guān)的衡量指標,部分指標在訂定的一開始,本身即包涵了商業(yè)與體驗維度。

 

2、工作中可能用到的幾種體驗衡量指標

大部分的體驗衡量指標,都會基于三個主要價值觀,結(jié)合其他用戶態(tài)度類型作為衡量基準。

  1. 可用性
  2. 參與度
  3. 轉(zhuǎn)化率+ User Attitude

下面介紹幾種,在工作中可能常用到的通用型,與不同業(yè)務(wù)場景型的體驗衡量指標。

2.1 通用型

01 傳統(tǒng)網(wǎng)站服務(wù)使用的PULSE

PULSE 是基于商業(yè)和技術(shù)的衡量模型,被很多組織和公司廣泛應(yīng)用于跟蹤產(chǎn)品的整體表現(xiàn)。包含:

  • Page view 頁面瀏覽量
  • Uptime 響應(yīng)時間
  • Latency 延遲
  • Seven days active user 7天活躍用戶數(shù)
  • Earning 收益

但不難看出PULSE 指標僅覆蓋了UX 設(shè)計中最最基礎(chǔ)的可用性部分,和衡量用戶體驗的直接關(guān)系不大,難以評估設(shè)計工作到來的影響,畢竟這個指標創(chuàng)建之初是用來衡量產(chǎn)品的技術(shù)與商業(yè)效果。

因此為了彌補PULSE 指標中存在的問題,Google 提出了HEART 指標模型。HEART 是“以用戶為中心度量的指標體系,以及把產(chǎn)品目標與創(chuàng)建指標體系相互關(guān)聯(lián)的過程”

02 以使用者為中心的HEART

HEART其實也是業(yè)界使用的老黃歷了,尤其常用GA ( Google Analytics ) / Adobe Omniture的人一定都對他不陌生。

早期產(chǎn)品開發(fā)上線的階段,大多是訂定業(yè)務(wù)KPI 作為衡量項目產(chǎn)出的價值,但在用戶體驗的部份,卻很難有可視化以可及量化的衡量指標。因此Google 嘗試把產(chǎn)品目標以及體驗指標相互結(jié)合,建立以用戶為中心的HEART 度量體系。

Google Heart 體驗衡量指標模型

 

2.2 Saas 服務(wù)型

01 NPS( Net Promoter Score凈推薦值)

凈推薦值最早是由貝恩咨詢的創(chuàng)始人Fred Reichheld 在2003 提出,通過測量用戶的推薦意愿,從而了解用戶之于產(chǎn)品或服務(wù)的忠誠態(tài)度。

NPS 算是近幾年用戶體驗領(lǐng)域上的當(dāng)紅指標(甚至業(yè)內(nèi)還有所謂的NPS 教派XD),基本上互聯(lián)網(wǎng)類產(chǎn)品都可以使用。其基本核心理念是,一個企業(yè)的用戶可被劃分為三類:推薦者、中立者和批評者。

  1. 推薦者是投入且重復(fù)使用產(chǎn)品的用戶,他們會熱情地向其他人推薦你的產(chǎn)品或服務(wù)。
  2. 被動者是對產(chǎn)品滿意,但缺乏熱情和忠誠度的用戶,他們很容易轉(zhuǎn)而投向使用競爭者的產(chǎn)品或服務(wù)。
  3. 批評者是那些明顯對企業(yè)的產(chǎn)品或服務(wù)不滿意的那部分用戶

相較于其他的指標,NPS 詢問的是意愿而不是情感,對用戶來說更容易回答,且直接反應(yīng)了客戶對企業(yè)的忠誠度和購買意愿,在一定程度上可以看到企業(yè)當(dāng)前和未來一段時間的發(fā)展趨勢和持續(xù)盈利能力。

02 CES( Customer Effort Score用戶費力度)

CES 指的是你的產(chǎn)品或服務(wù),會需要用戶花費多少力氣才能滿足自身需求。

根據(jù)Oracle 的一項研究,82%的人把他們的購買經(jīng)歷描述為“花費太多的努力”,CES背后的理論就是,應(yīng)該想辦法減少客戶為了解決問題而付出的努力。CES可以幫助你找出可優(yōu)化的方向,更容易理解在哪里進行改善,較低的費力度也與客戶留存直接相關(guān),從而增加客戶的生命周期價值。

一般情況下,大多會先利用CSAT、PSAT這類的指標來衡量客戶對產(chǎn)品或服務(wù)的體驗反饋,當(dāng)這套標準的價值到達臨界點時,就應(yīng)該嘗試CES作為滿意度指標的擴充,更充分的評估Saas產(chǎn)品的用戶體驗情況。

03 FCR( First contact resolution一次性解決率)

作為Saas類服務(wù)型產(chǎn)品,在獲取新客或幫助舊客時,大多是通過客戶服務(wù),在許多的互聯(lián)網(wǎng)公司Customer Service團隊也是重點投入資源的。而「FCR一次解決率」即是用來衡量這類客戶服務(wù)的指標。

FCR 是指客戶的服務(wù)需求在第一次客戶服務(wù)中完全解決的占比率。

測量一次性解決率是相當(dāng)簡單的。通過單次交互(電子郵件響應(yīng),電話,聊天會話等)解決你收到的客戶請求數(shù)量,并除以同一時期收到的請求總數(shù)。

一次性解決率不僅對Saas 產(chǎn)品的客戶至為重要,也能體現(xiàn)客戶服務(wù)的績效和表現(xiàn),甚至深入到每個員工的層面上。

 

2.3 系統(tǒng)性評估型

01 SUS( System Usability Scale系統(tǒng)可用性量表)、QUIS(Questionnaire for User Interface Satisfaction用戶交互滿意度)

SUS 應(yīng)該也算是用來評估單個用戶使用某個產(chǎn)品的可用性時,最常見的指標了。SUS 是一種用來量化定性數(shù)據(jù)的方法,并不僅僅依靠數(shù)據(jù)統(tǒng)計,需要結(jié)合用戶具體參與來進行調(diào)研,通常作為可用性測試的組成部分。

SUS 通常用來作為改版效果的整體評估,在使用時可以對題目的主詞產(chǎn)品進行替換,這些替換對最后的測量結(jié)果都沒有影響。

而QUIS 則可以說是SUS 的進階版,會更注重具體頁面或操作節(jié)點的易用性,通常作為SUS 的延伸使用。比較簡單的QUIS 版本包括27 個問題,分為5個類別:

Overall Reaction 總體反應(yīng)、Screen 屏幕、Terminology/System Information 術(shù)語/系統(tǒng)信息、Learning 學(xué)習(xí)、System Capability 系統(tǒng)能力

02 CSAT( Customer Satisfaction客戶滿意度)、PSAT( Purchase Satisfaction購買滿意度)

客戶滿意度也算是經(jīng)典的衡量指標之一了,隨著商業(yè)競爭的激烈,各類型的產(chǎn)品與企業(yè)都對客戶滿意度更加重視,很多時候你所熟悉的電話滿意調(diào)研、電子郵件調(diào)研,甚至直接在消費后的星級評分,其實都是關(guān)于這類問題的問券。

PSAT 則是在CSAT 的基礎(chǔ)上,針對消費類型產(chǎn)品進行細化,強調(diào)售后使用體驗的部分。這類問卷的好處是簡單且擴展性強,可大至系統(tǒng)小至任務(wù)。

但缺點就是用戶容易在中等范圍內(nèi)回答問題,無法給企業(yè)帶來真實的反饋。而且,即使在客戶滿意度很高的情況下,依然有可能遭遇留存流失問題。

因為滿意度并不直接與客戶忠誠度相關(guān)聯(lián)。

其他相關(guān)的系統(tǒng)性可用型指標當(dāng)然還有許多,不過在工作流程中一般來說都較少會使用到,主要還是更具專業(yè)性的用研User Researcher 角色較常使用,包含:

  • SUMI(Software Usability Measurement Inventory 軟件可用性測試)
  • CSUQ(Computer System questionnaire 計算機系統(tǒng)可用性測試
  • USE (Usefulness, Satisfaction, and Ease of Use 有用性、滿意度、易用性)

 

2.4 電商產(chǎn)品型

01 PSM(Price Sensitivity Measurement 價格敏感度測試)

PSM 衡量目標用戶對不同價格的滿意及接受程度,了解其認為合適的產(chǎn)品價格,從而得到產(chǎn)品價格的可接受范圍。

PSM 考慮了消費者的主觀意愿,又兼顧了企業(yè)追求最大利益的需求。但測試過程主要基于目標對象的自然反應(yīng),沒有涉及到任何競爭產(chǎn)品的信息。所以在橫向拉通上顯得較為薄弱。

也正因為缺少對于競爭產(chǎn)品的分析,所以PSM 目前主要集中在自成體系的產(chǎn)品鏈路中,用來配合Saas 服務(wù)或虛擬產(chǎn)品的定價,在實體產(chǎn)品中已經(jīng)較少被使用。

02 DSR(店鋪質(zhì)量評分)

DSR 算是電子商務(wù)類產(chǎn)品中的特殊指標,初期是在在阿里巴巴的電商生態(tài)中大規(guī)模使用,目前也慢慢變成電商場景的通用指標。

DSR 是指買家在電商平臺上購物成功后,針對本次購物給出的評價分數(shù)。買家可以評分的項目包括「描述相符、服務(wù)態(tài)度、發(fā)貨速度、物流速度」4 項。

DSR 評分計算方法:每項店鋪評分取連續(xù)6個月內(nèi)買家給與該項評分的總和/連續(xù)6個月內(nèi)買家給與該項評分的次數(shù),統(tǒng)計最近180天

DSR 評分直接影響賣家在電商平臺中,商品搜索曝光權(quán)重的高低,從而影響商品與店鋪的排名。因此對于平臺類的UX Design Team 來說,建立類似DSR 的曝光評分機制,也是間接影響服務(wù)提供商的產(chǎn)品體驗,進而提升整體平臺中的用戶體驗質(zhì)量。

03 ZMOT(Zero Moment Of Truth第零關(guān)鍵時刻)、FMOT(First Moment Of Truth第一關(guān)鍵時刻)、SMOT(Second Moment Of Truth第二關(guān)鍵時刻)

FMOT & SMOT 是目前新零售場景常會提到的指標模型,但其實在傳統(tǒng)的零售行業(yè)早就是一個通用的衡量指標,F(xiàn)MOT 指的是消費者在接觸到對應(yīng)商品貨價的關(guān)鍵3~7 秒,所有的商品售價、包裝、擺設(shè)都是在這關(guān)鍵3~7 影響消費者拿取商品甚至購買的關(guān)鍵因素。

而SMOT 則是指這類實體產(chǎn)品,在消費者購買回家后的首次體驗,是否符合這個商品的廣告語,對于一個品牌來說,即是是否成功地履行了它的承諾還是令人感到失望,這也是消費者是否會成為一個品牌的粉絲,甚至在線上或線下渠道分享的關(guān)鍵(是否很像NPS 的精神?)。

延伸出的ZMOT,即是線上線下結(jié)合的新零售關(guān)鍵指標,讓消費者在「尚未接觸」到特定商品前,就透過線上向消費者進行行銷,當(dāng)消費者主動進行相似活動、搜索時,就能接收到產(chǎn)品的正面訊息來影響消費意向。

本質(zhì)核心也就是

當(dāng)廣告出現(xiàn)在用戶需要的時刻,就變成了服務(wù)

ZMOT & FMOT & SMOT

 

2.5 主觀評估型

用戶體驗的主觀評估,大多是偏觀察式的方法,也是大家比較耳熟能詳?shù)挠枚ㄐ哉{(diào)研法,比如眼動儀、觀察法、品牌問卷… etc.。

當(dāng)然如果要盡可能嘗試量化這類User Attitude 主觀評估數(shù)據(jù)時,前提都是把用戶體驗理解成兩種維度,一種維度是實用性(Pragmatic)偏向常說的可用性,另一種是享樂性(Hedonic)也就是常說的舒適性,享樂性維度還會被拆分成了幾種屬性,例如Stimulation和Identification。

01 UEQ(User Experience Questionnaire 用戶體驗調(diào)查表)

UEQ 是SAP 開發(fā)的一套定量分析用戶體驗的工具。用戶在問卷上表達出他們在使用產(chǎn)品和服務(wù)中的感受,印象和態(tài)度,然后生成一個包含用戶體驗數(shù)個方面的量化表。包括傳統(tǒng)的易用性方面的指標:

  • Efficiency
  • Perspicuity 易懂
  • Dependability 可信任

也包括三個體驗方便的指標:

  • Attractiveness 吸引度
  • Stimulation 激勵性
  • Novelty 新鮮度

02 HQ(Hedonic Quality享受性質(zhì)量)、PQ(Pragmatic Quality實用性質(zhì)量)& AttrakDiff

HQ 主要是用來消費型產(chǎn)品的情感衡量指標,較常使用消費者對于消費類型產(chǎn)品的評價。而PQ 則主要是在易用性層面上加入主觀因素的評分,如果要針對性地對HQ & PQ 進行系統(tǒng)性評分,AttrakDiff 則是一個較常使用的工具。

AttrakDiff 包含了28 項題目,每一項都是一個7 分制量表,分和最高分代表一對具有評價性質(zhì)的反義詞,用戶需要根據(jù)使用產(chǎn)品過程中的某一方面的體驗從低到高進行評分,比如“混亂的— — 清晰的”,分數(shù)越高,表明產(chǎn)品的某一方面設(shè)計得越清晰。

 

3、寫在最后

在產(chǎn)品或業(yè)務(wù)中導(dǎo)入體驗數(shù)據(jù)衡量指標,不是新入行的設(shè)計師想像的這么簡單。真正的實務(wù)過程絕不是將文章中的指標,直接導(dǎo)入自己對接的產(chǎn)品中,每一個數(shù)據(jù)指標都有其目的,且不同的人即便看到的數(shù)據(jù)相同,也都會有自己的解讀方式。

過于依賴指標,如果不隨時依據(jù)市場動態(tài)與公司策略進行調(diào)整,不僅容易因為短期的良好數(shù)據(jù)忽視了中長期的產(chǎn)品成長,也會慢慢的喪失設(shè)計師的感性創(chuàng)意能力。

所以,清楚的認知到哪個指標可以幫助我進行什么樣的設(shè)計策略。才是真正的使用方式。千萬別讓設(shè)計師變成動作導(dǎo)向的工作職位,

Value-Driven 價值導(dǎo)向的工作模式,才是設(shè)計師的生存法則

藍藍設(shè)計www.bouu.cn )是一家專注而深入的界面設(shè)計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設(shè)計、BS界面設(shè)計 、 cs界面設(shè)計 、 ipad界面設(shè)計 、 包裝設(shè)計 、 圖標定制 、 用戶體驗 、交互設(shè)計、 網(wǎng)站建設(shè) 平面設(shè)計服務(wù)。

分享本文至:

日歷

鏈接

個人資料

藍藍設(shè)計的小編 http://www.bouu.cn

存檔