為什么網站項目只需要5個人來做測試?_建站經驗教程
推薦:一個站長與電腦相處的十三年記得那是一九九四年的夏天,我和大多數(shù)的打工者一樣,乘坐南下的火車來到了深圳。當時的心愿,就是每月能掙點錢幫補一下家里,由于只有高中文化,就匆匆找了一份衛(wèi)生服務的苦活,雖然一月僅450元,但對剛從內地出來的我來說也感覺相當不錯,每月除給家里寄回三百元外,
人們總是認為,用戶測試是一個復雜且代價昂貴的事情。一個網站設計項目需要一個龐大的預算和長長的時間表。其實,可用性測試并非如大多數(shù)人認為的是浪費資源的事情。在你可承受的測試成本范圍內,使用不超過5個用戶,即可達到很好的測試效果。
最初的研究過程中,Tom Landauer 和我得出了一個 可用性測試方面的,關于測試人員的數(shù)量的公式:
假設一個可用性測試的測試人員數(shù)量為n,N為所有可用性測試發(fā)現(xiàn)的問題總數(shù),L是單個測試人員的問題發(fā)現(xiàn)率。
N(1-(1-L)n)
我們發(fā)現(xiàn),大多數(shù)項目的平均的問題發(fā)現(xiàn)率為31%。當 L=31%時,可以得到如下:
當用戶為零時,發(fā)現(xiàn)的問題數(shù)目是零,即“零用戶零發(fā)現(xiàn)”。我們可以看到,第一個用戶幾乎發(fā)現(xiàn)的三分之一的設計的可用性的問題,和零發(fā)現(xiàn)截然不同。當我們看第二個用戶的測試情況時,可以發(fā)現(xiàn),有一部分問題是和第一個user重合的。人們之間的行為或發(fā)現(xiàn)有一定的差異,第二個user可以發(fā)現(xiàn)一些不同于第一個user的問題,有區(qū)別于第一個用戶的新發(fā)現(xiàn),但是問題數(shù)量不及第一個用戶的最初發(fā)現(xiàn)。第三個用戶做了很多前兩者重復的事情,有些甚至重復2次。另外,當然,第三個用戶本身異能發(fā)現(xiàn)少量的新問題,顯然數(shù)量遠遠不及前 兩個用戶。
現(xiàn)在,加入更多的測試人員(user),你會發(fā)現(xiàn)一個現(xiàn)象,隨著人數(shù)的增加,重復的事情一再出現(xiàn),發(fā)現(xiàn)的新問題發(fā)現(xiàn)率開始下降。顯然不再需要讓更多的人來重復發(fā)現(xiàn)重復的問題,自然回回去重新設計,以解決發(fā)現(xiàn)問題。
到了第5個user,你就是在浪費時間,去做重復的事情,并且?guī)缀踉贈]有先的發(fā)現(xiàn)。
迭代設計
上圖中的曲線很清除地標明,至少需要15個用戶去發(fā)現(xiàn)所有的設計中的可用性問題。但是,為什么我更傾向于推薦用更少的測試人員呢?一個主要的原因是合理分配可用性測試的預算。讓我們看看,當你招聘15個客戶代表來對你的設計進行測試時,就一位著你得花費5個用戶的3倍的費用!
當我們去做用戶的可用性測試時,最終的目標是為了解決或者提高實際的設計,而不是僅僅得到一份書面的報告。當5個用戶的首次測試發(fā)現(xiàn)了85%的可用性問題時,你已經可以在下一個desagn中修復這些問題。
假如想發(fā)現(xiàn)更多的問題,當然需要再次測試。即使我說重新設計可以修復第一次測試時發(fā)現(xiàn)的問題,事實是你可能認為新的設計可以客服已有的問題。但是,在沒有人能設計出更完美的用戶界面之前,無法保證新的設計可以修復事實存在的問題。第二次測試可以回歸已有的問題,確認是否修復。同時,一個新的設計,意味著還需要一次新的用戶測試。
5個用戶的第二次測試,可以發(fā)現(xiàn)第一次測試時遺留的15%的問題。(仍然會有2%的問題遺留要等到第三次測試來發(fā)現(xiàn))。
最終,第二次測試的深度可以設計到網站的設計架構,獲取到我們所需的一些信息,如體系架構、任務流程等是否符合客戶需求。這些問題經常在隱藏在一些表面的可用性問題之后,而為人們所忽略。
所以,第二次的測試作為第一次測試的質量保障,并且可以發(fā)現(xiàn)更深入的問題。第二次測試會為系統(tǒng)的重新設計提供一份新的問題清單,但數(shù)量顯然會少于第一次測試。但是,本次測試并不能完全補充第一次測試,還需要第三次的測試來進行查漏補缺。
5個用戶三次的最終測試效果要遠高于15個用戶測試一次的效果。
為什么不建議單用戶的測試?單個人的行為總會有一些風險,人總會有一些意外的,不確定的行為。
你可能會認為15個用戶做一輪測試,比5個用戶做3輪要好。因為曲線表明,第一個用戶的發(fā)現(xiàn)率明顯高于后續(xù)的用戶,但是,為什么我們要堅持多輪測試?兩個原因:第一,通過觀察3個人就可以看到用戶行為的多樣性,可以洞察到那些行為是獨特的那些是可以一概而論的;第二,用戶測試的成本效益分析表明,3-5個測試用戶的最佳比例,依靠于測試的風格。初始的運行成本和測試計劃相關,多個用戶對于降低最初的成本效果更好。
分享:閑話:spam、帖吧、網摘、其他什么是spam? 網絡技術中,最開始是指垃圾郵件的意思,后來在搜索引擎技術中,大概針對的是專門欺騙搜索引擎以及用戶的信息一般來主要是指名不副實的內容。 什么叫名不副實呢?比如我的title里寫著賣手機,頁面里也有幾個地方藏著手機這個詞,結果我賣的是馬桶。這個就
- 相關鏈接:
- 教程說明:
建站經驗教程-為什么網站項目只需要5個人來做測試?
。