摘要:目的 / 意義生成式人工智能產品正成為人們新的信息獲取渠道。人們在日常生活情境下如何看待和使用生成式人工智能產品,以及這類產品在輔助人們完成日常生活情境任務時的表現如何,都需要大量的實證研究。本文以 ChatGPT3.5 的熟練用戶為研究對象,分析用戶在日常生活情境下與生成式人工智能的交互行為。研究設計 / 方法采取縱向研究設計,結合日記法和訪談法,記錄熟練使用 ChatGPT 的高校學生在日常生活中與 ChatGPT 的交互過程,采用定性與定量結合的分析方法,歸納用戶使用 ChatGPT 完成的任務類型,比較不同類型任務下用戶的交互行為和體驗差異。結論 / 發現在日常生活中,高校用戶利用 ChatGPT 完成的任務類型可以按照認知復雜度分為:信息獲取型、理解型、操作型、分析評估型、創造表達型等五類任務。其中用戶對信息獲取型、理解型、操作型任務表現出較高滿意度水平,而對分析評估型任務的滿意度略低、對創造表達型任務的滿意度存在較大差異。創新 / 價值從認知層次歸納任務類型,可以為未來 AIGC 提供可操作的評價維度,有助于發掘智能交流時代的用戶信息需求,豐富 AI 賦能視角下的信息行為領域的研究內容和成果。

">

欧美一级在线毛片免费观看,国产成人精品视频一区二区不卡 ,成年人精品视频,国产精品手机视频

學術咨詢

讓期刊論文更省時、省事、省心

圖書情報知識雜志投稿格式參考范文:日常生活情境下用戶與生成式人工智能交互行為分析

時間:

  1 引言

  生成式人工智能(Generative AI, Gen AI)利用復雜的算法和神經網絡來模擬人類的創造力,通過生成模型來產生新的內容,用戶可以將 Gen AI 用作全新的創作工具。相比之下,過去使用傳統搜索系統時,用戶依賴于檢索來獲得目標信息,并且還需對其呈現的結果甄別判斷,而 Gen AI 能夠幫助用戶篩選出最有效的信息。隨著信息和數據的內容、來源、體量及形式的爆發式增長,用戶對精準定位和快速呈現有效信息的需求與日俱增。用戶在使用 Gen AI 的過程中,僅以自然語言形式提問便可獲得更符合提問者本身需求和興趣的個性化信息。同時 Gen AI 具有創意寫作、論文寫作、代碼生成、問題回答等多樣化的功能,能夠顯著減少信息過載問題。

  目前,國內外都已經推出許多 Gen AI 的產品,ChatGPT 就是其中的典型代表。作為 Open AI 公司于 2022 年最早推出的大語言生成模型,其一經發布便吸引了大量的互聯網用戶,得到社會的廣泛討論,也引發了學界重點關注。ChatGPT 在上下文學習、基于人類的反饋來強化學習等方面已經取得了關鍵性突破,其能夠生成質量較高的自然語言文本,在交互對話、機器翻譯、文本摘要等任務中表現突出,給人們的生活帶來極大便利,顯著提升了人們生產生活的效率。隨著 Gen AI 的進步和普及,用戶與 Gen AI 產品的交互更加日常化,溝通方式不斷豐富,形成了全新的互動模式。在新的技術環境下,用戶的信息行為可能呈現出新的特征,這些特征對于揭示和理解人類信息行為、幫助用戶適應快速變化的信息社會具有重要價值。

  基于此,本研究嘗試回答以下問題:

  用戶使用 Gen AI 完成哪些任務類型?

  Gen AI 在這些任務中扮演著哪些角色?

  在完成不同類型任務時,用戶對 Gen AI 的滿意度如何?

  用戶在使用 Gen AI 時,在會話時長和對話輪次這兩個維度上展現出哪些特征?

  為回答以上問題,本文采用日記法收集用戶行為的實時記錄。日記法可以實時記錄個人想法、感覺和行為及其變化,收集個體在自然、真實的場景之下評估某種現象或者過程的數據,日記法時效性較強,有助于避免記憶衰退導致的回憶錯誤。為了更加全面收集 Gen AI 用戶的信息行為數據,本研究除采用日記法外,也使用訪談法進一步了解用戶對生成式人工智能產品的看法。

  總之,本文試圖探討以 ChatGPT 為代表的 Gen AI 如何為信息行為主體賦能,探索用戶使用 Gen AI 完成的任務類型,并對不同任務類型下用戶與 Gen AI 的交互特征進行分析,以此豐富 AI 賦能視角下的信息行為領域的內容和成果,也為現實中 Gen AI 產品的優化和設計提供一定的理論參考,促使生成式人工智能更好地服務于人們的日常使用。

  2 相關研究

  2.1 信息行為領域下任務類型的相關研究

  搜索任務一直是信息行為領域關注重點,因為人們在表達其信息需求的時候存在各種障礙,常無法清楚明確地表達自己的信息需求,但是相對而言,搜索任務的表達更加容易。并且,搜索任務不僅是用戶信息搜尋的動力,也是影響信息搜尋的主要因素。通過對信息搜尋任務展開研究有助于更深入地理解用戶信息行為。

  首先,大部分研究主要從任務的不同階段以及任務變量兩個角度來劃分任務類型,進而考慮任務類型對信息行為的影響。Broder 對用戶的信息行為進行總結歸納,采用問卷調查的方式收集用戶活動信息,確定出導航型(navigational)、信息型(informational)和事務型(transactional)三種任務類型。Kellar 等人通過分析參與者的網絡活動交互記錄,確定出任務的五種框架,包括事實發現(fact finding)、信息采集(information gathering)、瀏覽(browsing)、事務處理(performing a transaction)、其他(other)任務。

  此外,也有研究通過對任務分面的分析,將不同的分面進行組合,以此劃分任務類型。如 Melanie 總結出了影響信息行為的變量列表,將任務特征歸納為固有任務特征、外部任務特征、任務執行者、任務和執行者的關系四大類。Li 采用面分類法,將任務按照類別、面、子面、值來劃分,得出了任務通用類(generic facet)和共同屬性類(common attributes)兩大類別。Campbell 從路徑多樣性、目標多樣性、子任務的相關性、結果的不確定性四個維度測量任務的復雜性水平。Zhang 提出,概念的數量會影響任務的復雜性。根據任務變量劃分任務類型,有助于理清任務與信息行為之間的關系。依據任務特征的不同,可以采用不同方式劃分任務類型。Bloom 將認知目標劃分為記憶、理解、應用、分析、評價和創造六個層次,學習型搜索的相關研究常以 Bloom 的認知目標來劃分學習型搜索任務類型。以認知復雜度為依據劃分任務類型的好處是,可以更方便了解和刻畫用戶對于完成該任務需要付出的認知努力。

  因此,本文也將嘗試從認知復雜度的視角劃分用戶使用 ChatGPT 完成的任務類型,并基于此分析不同類型下用戶的交互行為特征和搜索體驗。

  2.2 信息行為領域下生成式人工智能的相關研究

  Marchionini 曾提出,在 Gen AI 所帶來的變革中,信息學與圖書館學專業人員有責任 “以人為中心” 研究和審視人工智能增強的世界。“以人為中心” 主要體現在對用戶使用意愿和用戶體驗的關切。

  國內與用戶使用生成式人工智能的相關研究主要關注用戶使用意愿這一方面,包括技術使用影響因素、內容采納意愿影響因素。有研究發現影響用戶對 ChatGPT 所生成內容的采納意愿的因素主要是信息質量、用戶感知和技術特點,構建出生成式人工智能用戶采納意愿影響因素模型。張海研究發現主體因素、技術因素、信息因素、社會環境等都是影響用戶使用生成式人工智能的重要因素,人工智能生成技術可能帶來職業風險和技術風險。周濤對收集的數據采用混合方法進行分析,對用戶從問答社區到 Gen AI 的轉移行為進行探索,發現轉移的意愿受到信息過載等推力因素、感知準確度等拉力因素、社會影響等錨定因素的影響。除了用戶意愿影響因素研究之外,不同場景下的任務完成效果也是關切之一。游俊哲從科研學習等場景探討了生成式人工智能的應用,發現科研場景對信息質量的要求更高。也有研究從任務完成效果的角度對 ChatGPT 進行研究,從知識組織和實際業務出發,設計文獻著錄、標引、本體構建等不同類型的任務,發現 ChatGPT 的創造力仍然較為有限,實際業務離不開專業人員。

  國外信息行為領域中,用戶使用生成式人工智能的研究主要關注不同場景下的用戶體驗。有多位學者關注 ChatGPT 等生成式人工智能在教育領域中的應用,討論大型語言模型如何建設教育內容、提高學生參與度和個性化學習體驗,對生成式人工智能在教育領域應用的機遇和挑戰展開探討;了解用戶使用 ChatGPT 的基本情況及用戶體驗,發現 ChatGPT 支持創造性的活動這一功能給用戶體驗帶來積極影響,而需求不明確、信任問題也會給用戶帶來消極體驗。在用戶體驗這一話題之下,一些研究強調需要提供更多支持性的功能,例如提示建議、對話解釋等功能,專門針對交互場景進行優化。另外,由于生成式人工智能可以與用戶進行對話交流,對話代理或對話式搜索引擎也是熱點話題之一。有研究指出當前以 ChatGPT 為代表的對話系統更具被動性,這種被動性限制了生成式人工智能本身的效用,需要增強對話代理的主動交互性、關注用戶不斷變化的任務狀態,以此來優化當前的搜索會話。

  通過回顧以上文獻,本文發現目前信息行為領域下的生成式人工智能研究主要集中于用戶使用意愿及用戶體驗,從任務類型角度進行分析的研究較為缺乏。因此,本文重點關注 Gen AI 用戶的任務類型,并探討在不同類型任務下用戶的交互行為和體驗的差異。

  3 研究方法

  由于生成式人工智能是新型的信息技術,本文結合以往研究中所采用的探索性研究方式,采用日記法及訪談法展開研究工作。

  3.1 參與者情況

  本次研究通過校內學生交流平臺招募熟練使用 ChatGPT 的用戶,最終招募到了 19 位參與者,均為高校學生。為確保研究樣本的有效性和代表性,我們在招募階段通過校內網絡平臺隨機發放問卷以確保選取過程的隨機性,并在報名人員中納入所有符合 “熟練使用 ChatGPT” 這一必需條件的參與者,樣本在性別、學歷及學部來源均呈現多樣性。參與者的性別上,女性 13 位,男性 6 位。參與者的學歷分布上,本科 10 人,碩士 4 人,博士 5 人。參與者學部來源上,社科學部 5 人,人文學部 1 人,信息與工程學部 4 人,經管學部 3 人,理學學部 4 人,跨學科學部 1 人。在這些參與者中,超過 80% 的人員使用 ChatGPT 已超過了三個月及以上,70% 的人員平均每周使用 ChatGPT10 次以上,使用熟練程度均較高。

  3.2 研究流程設計

  首先,我們在校內學生活躍的論壇平臺發放我們的招募問卷,明確參與的條件和具體要求。對所有的報名對象進行篩選,要求每位參與者簽署知情同意書,并以問卷調查的形式了解參與者的使用情況及其基本信息,具體包括使用情況、對 ChatGPT 基本原理的了解程度、性別、學歷、專業等信息。

  參與者隨后正式開展為期兩周的日記提交工作,日記單的內容主要包括獲取背景信息、了解參與者的使用過程和使用困難。另外,本文結合滿意度、信息質量等用戶體驗指標,在問卷中設計了用戶任務的完成度、用戶滿意度、回答準確性等評價類量表問題,以了解用戶使用 ChatGPT 體驗的基本情況。

  為了便于參與者記錄,日記單以問卷形式設計,要求參與者在每次登錄自己的設備使用 ChatGPT 后,以填寫問卷的方式記錄使用的過程,并將同一問題下的所有會話進行截圖并上傳到問卷當中。為了防止參與者提交高度重復的內容,我們要求參與者每天至多提交 3 條使用記錄,總數不超過 30 條。在參與者提交使用記錄的兩周內,為了確保用戶及時提交,研究人員根據用戶使用 ChatGPT 的時間及問卷提交時間,每日將提交情況及時反饋給參與者,以確保所收集到的用戶使用記錄數據的準確性。

  使用日記收集結束后,我們也基于用戶的使用記錄對每位參與者進行了半結構化的訪談,重點圍繞不清楚的條目、作為熟練用戶對生成式人工智能未來發展的看法展開。

  3.3 數據處理與分析

  利用日記法與訪談法收集數據,本次研究共收集了 19 位參與者近 2-3 周的 ChatGPT 有效使用日記 498 條,以及 283 分鐘的訪談錄音數據。本研究利用 Excel 及 SPSS 來匯總和處理日記記錄中的結構化數據,對于非結構化題目所產生的資料,經過人工檢查和處理,采用主題分析方法進行編碼。為保證研究結果的說服力,編碼過程中兩位編碼人員獨立進行,并在形成編碼體系過程中多次討論,最終通過了編碼結果的一致性檢驗。

  通過對日記及訪談所采集到的文本資料進行歸納性的內容分析,我們從中提煉出初始性編碼語句,以自下而上的方式構建出二級編碼,并結合 Bloom 提出的六個層次認知目標,從認知水平的角度將參與者利用 Gen AI 完成的任務類型歸納為以下五種類別。

  4 研究結果

  4.1 用戶使用生成式人工智能的總體情況

  首先,本文對參與者使用 ChatGPT 完成的任務類型及各維度進行了描述性統計。結果顯示,信息獲取型、操作型、創造表達型三類任務的出現頻次較高,依次占比 41%、19%、15%。滿意度上,用戶對 ChatGPT 完成操作型任務的滿意度最高(M=6.98),對創造表達型任務的滿意度最低(M=4.00)。

  本研究記錄了用戶使用 ChatGPT 的時長、對話輪次兩個維度的交互情況,結果顯示創造表達型任務所耗費的平均時長最高(M=9.29 分鐘),信息獲取型任務所耗費時長最低(M=5.75 分鐘)。

  另外,參與者在日記中也記錄了用戶在使用 ChatGPT 時所登入的設備、對其生成信息的采納程度以及是否結合其他平臺輔助自己完成任務。經分析發現,超過 80% 的參與者選擇在電腦端進行登錄,大多參與者表示在電腦端來處理信息任務比移動端便捷;超過一半的使用記錄反映部分采納了 ChatGPT 所提供的內容,參與者基本上都可以從生成式人工智能所給的反饋中獲取一定的信息;只有 16% 的使用記錄體現參與者會結合其他的平臺例如 Google、Bing、百度、小紅書、維基百科等其他平臺來輔助信息獲取或驗證信息。

  4.2 不同任務類型下用戶對生成式人工智能的滿意度評價

  本節對參與者使用 ChatGPT 完成的任務類型的滿意度進行了描述性統計,可以發現信息獲取型、理解型、操作型任務下的二級任務類型滿意度均較高,而分析評估型和創造表達型下的二級任務類型滿意度較低。

  1)信息獲取型任務的滿意度較高

  信息獲取型任務的滿意度評價總體分數較高(M=6.06)。其中,參與者對主題搜集類任務的滿意度評分集中在 6 分及以上的高分區域。對于來源查找類任務,用戶的滿意度評價分數波動程度較大,其滿意度評分主要集中在 4 分及 5 分等中等分數區域。本文發現在來源查找類任務中,ChatGPT 向用戶提供的信息獲取渠道較為準確,例如圖片素材、語言學習網站;但是 ChatGPT 無法給出指定論文或書籍等具體信息內容,對原文的定位準確度不高。因此,來源查找類任務的滿意度波動程度較大。

  2)理解型任務的滿意度較高

  理解型任務滿意度得分較高(M=6.79)。對于信息解讀類任務和文本翻譯類任務,參與者滿意度評分在 6 分及以上的占比超八成,呈現很高的滿意度水平。然而,思維啟發類任務的滿意度相對較低,主要集中于中等評分區域,我們認為這可能與信息主題的復雜度相關,隨著用戶的信息主題愈加復雜,生成式人工智能的表現有所下降。

  3)操作型任務的滿意度評價呈較高的水平

  操作型任務的滿意度評價也呈現出較高的水平。其中,形式轉換類任務(M=6.75)和操作指導類任務(M=7.00),均呈現較高的滿意水平。在參與者提供的日記中,不少記錄反映 ChatGPT 在代碼寫作以及對信息形式加工中的表現良好,能夠根據需求生成不同的計算機語言,并且能夠正常運行。

  4)分析評估型任務的滿意度略低

  相比于前幾類任務類型,分析評估型任務的滿意度評價水平相對較低(M=4.45)。其中,問題分析類任務及交互學習類任務的滿意度集中在中等評分區域,低分區域占比更高。我們認為對于分析評估型任務,一方面需要 Gen AI 能夠理解用戶表達出的需求,另一方面也需要用戶采用合理的提示詞來傳達盡可能詳細的信息以便 Gen AI 進行判別。因此,用戶對生成式人工智能完成分析評估型任務的滿意度較低的原因與 Gen AI 本身及用戶需求表達兩個方面相關。

  5)創造表達型任務的滿意度較低且存在較大差異

  創造表達型任務的滿意度總體較低,該任務下的不同二級任務的滿意度差異較大,且低分評價的占比較高。創新表達類、概括總結類任務的滿意度均集中在低分區域,相較于信息獲取型等任務其滿意度較低。基于此,我們認為雖然生成式人工智能具有完成概括總結、文本優化等深入到文本內容的功能,但是所提供內容的信息質量、信息結構、信息專業程度、信息邏輯程度仍然有限。

  4.3 用戶與生成式人工智能的交互特征

  目前生成式人工智能已經成為用戶日常生活中獲取信息的新渠道,根據日記和訪談文本分析,本文發現用戶在使用 Gen AI 的過程中呈現以下的交互特征。

  1)不同任務類型之間的時長存在顯著差異

  本文探究了不同任務類型之間的時長是否存在顯著差異,發現用戶使用 Gen AI 完成創造表達任務(M=9.29 分鐘)和操作型任務(M=8.81 分鐘)比信息獲取任務(M=5.75 分鐘)需要耗費更長的時間。我們采用單因素方差分析驗證不同任務類型之間的時長差異,由于不滿足方差齊性(p<0.05),采用非參數檢驗 Kruskal-Wallis(以下簡稱 “K-W 檢驗”)分析任務類型之間的差異。結果顯示,信息獲取型任務和操作型任務、完成信息獲取型和創造表達型任務的時長存在顯著性差異,完成操作型任務和創造表達型任務需要耗費更長的時間,其余任務類型之間的時長沒有顯著差異。

  進一步地,在二級任務類別上,相比于主題搜集類任務(M=5.85 分鐘),文本優化類任務(M=9.30 分鐘)往往需要耗費更長的時間。文本搜集類與文本優化類任務時長具有顯著性差異。同樣地,我們采用單因素方差分析驗證二級不同任務類型之間的時長差異,由于不滿足方差齊性(p<0.05),采用 K-W 檢驗進行分析。結果顯示,文本搜集類與文本優化類任務的時間花費具有顯著性差異,完成文本優化類任務需要耗費更長的時間,其余任務類型之間沒有顯著性差異。

  2)不同任務類型之間的對話輪次并不存在顯著的差異

  本文發現五種任務類型下用戶的對話輪次并不存在顯著性差異。通過對五種任務類型下用戶的對話輪次進行單因素方差分析,發現不同任務類型之間的對話輪次并不存在顯著的差異(F=0.503,p>0.001)。一般來說,這些任務類型的對話是 2-3 輪次。

  進一步地,二級任務類別之間也不存在顯著性差異。我們對二級任務類型的對話輪次進行單因素方差分析,由于不滿足方差齊性(p<0.05),采用 K-W 檢驗判斷任務類型之間的對話輪次是否存在顯著性差異。結果顯示二級任務類型之間的對話輪次并不存在顯著差異。

  5 討論與結論

  5.1 從認知層次劃分任務類型,有助于了解用戶需求、評估 Gen AI 的表現

  在信息搜索任務驅動下,越來越多的用戶正將 ChatGPT 作為智能會話代理來幫助其快速獲取和整合相關信息。從本研究收集到的數據來看,用戶使用 ChatGPT 的行為,往往是在完成各類任務下出現的。在以往的針對用戶使用生成式人工智能交互的研究中,有研究從主題角度將 Gen AI 用戶信息需求分為:信息檢索、解決問題、休閑和尋求創造力等類型。

  本文試圖從認知層次這一角度入手,不同于從任務的主題進行歸納,而是從認知復雜度出發對用戶使用以 ChatGPT 為代表的生成式人工智能的任務類型進行分析。我們發現用戶在使用生成式人工智能完成的任務類型可以從簡單到困難依次劃分為信息獲取型、理解型、操作型、分析評估型和創造表達型等五種任務類型。

  從認知復雜度的視角對用戶使用 ChatGPT 完成的任務類型進行分類,不僅提供了一個全新的視角來深入理解用戶的需求,而且對于未來理解和評估 Gen AI 的表現具有重要意義。通過分析用戶與 ChatGPT 在不同任務類型下的交互模式和任務完成情況,研究者可以構建更加細致和可操作性的評價框架,以評估 Gen AI 在處理各種任務時的效率、準確性和用戶滿意度。這種認知層次的分析有助于揭示用戶與 AI 交互的深層次動機和偏好,從而為改進 AI 的交互設計和功能提供指導。同時,這樣的框架也為 AI 開發者和研究人員提供了一個標準化的工具,不會受到不同主題的限制和影響,以衡量和比較不同 AI 系統在相似任務上的表現,進而推動人工智能技術的持續進步和創新。

  5.2 Gen AI 在用戶的工作和生活中扮演著多元角色

  相較于主要專注于輔助用戶完成信息獲取型任務的搜索引擎,輔助用戶完成操作型、理解型、分析評估型和創造表達型任務是生成式人工智能的特色。傳統情況下,用戶在日常生活中有遇到各類問題時,如文本處理、圖片處理等需求時,往往會自行尋找其他平臺。但是,Gen AI 的出現使得用戶意識到文本處理、分析理解、操作轉換等任務都可以轉變為信息需求,將生成式人工智能視為處理日常生活信息需求的綜合性平臺。

  這也說明生成式人工智能在用戶生活中具有 “人物化” 的特征,可能扮演著不同的角色。本文在對用戶完成不同類型任務的交互行為和體驗的分析基礎上發現,Gen AI 可能扮演著工具、助手和替代三種不同的角色。用戶在使用 Gen AI 解決計算、運用等操作性的問題時,可能會使用該工具去處理其中復雜的操作性的工作,并且會較大程度上直接采用 Gen AI 的結果,并將這個結果應用于自己的整體任務的完成,這種情況下,Gen AI 更具有工具屬性。當用戶需要快速地獲取關于主題的信息或者完成信息理解、信息評估等任務時,Gen AI 可以依據用戶的個性化提問給予解答,但是用戶常常只是部分采納其提供的結果,這種情況下,Gen AI 更多地扮演著助手的角色。另外,Gen AI 也可能完全替代用戶完成某些工作,用戶直接將整個任務交給 Gen AI 工具,這種情況下,它更像是人類的替代,完全地完成人需要完成的全部任務。通過本研究的分析,我們發現用戶完全采納 Gen AI 的情況占比并不高(35%)。Gen AI 在哪種類型的任務可能可以完全替代人類去完成,以及它在不同任務下的表現和可信賴程度,還需要未來更多更深入的分析。

  5.3 Gen AI 的創造力仍然有限,人智協作將成為主流模式

  Gen AI 已經成為了用戶獲取信息的關鍵渠道之一。用戶選擇使用生成式人工智能來獲取信息是因為相比于傳統的搜索引擎,生成式人工智能無須制定格式化的檢索詞,只需以自然語言的方式進行提問,而非傳統方式下以數個網頁呈現。這種呈現方式能夠替代用戶篩選并總結答案。從這一點來看,當用戶需要初步或者淺層次地了解一些信息時,生成式人工智能往往有更高的效率和更直觀的表達,無須用戶再次從大量的檢索結果中進行辨別與選擇。

  值得關注的是,隨著任務的認知難度和復雜度的上升,從信息獲取型任務到創造表達型任務,用戶的滿意度評價逐步降低。在已有的生成式人工智能用戶研究中,同樣發現由于 ChatGPT 創造性活動表現不佳而帶來負面的用戶體驗。尤其是概括總結、文本優化和創新表達等任務,當用戶有著從主題、內容、結構等各方面更復雜的處理需求時,ChatGPT 的表現往往受限。本文認為這一現象的主要原因是生成式人工智能在面對復雜任務時,其結果呈現的信息完整程度(例如呈現的維度及結構)、新穎程度(例如內容形式及創新水平)、可信程度(例如權威水平、邏輯程度、專業程度)等較為有限,可解釋性也有限,導致與用戶的預期不符,故而用戶對這些任務呈現較低的滿意度水平。因此,在未來一段時間內,人智協作將成為主流模式。

  6 貢獻與不足

  6.1 研究貢獻

  本研究通過自下而上的方式分析和歸納生成式人工智能用戶信息行為的任務類型,從用戶滿意度出發探索生成式人工智能產品的用戶體驗,并從時長和對話輪次兩個關鍵維度分析用戶交互行為特征。任務是影響信息搜尋的主要因素,本研究聚焦生成式人工智能新情境,從認知層次出發,不僅為未來 AIGC 提供可操作性的評價維度,也為構建智能交流時代用戶信息行為模型、發掘用戶信息需求做出理論貢獻。

  6.2 研究不足與未來展望

  本次研究也存在一定的不足,尚未針對用戶使用生成式人工智能的情境及信息內容深入挖掘,用戶與生成式人工智能的交互行為維度記錄有限。但是本文在 AI 賦能新興話題下對用戶信息行為進行開創性研究,不僅對信息行為研究領域具有學術意義,同時也對全球范圍內生成式人工智能產品的產出和優化提供理論支撐。

  本文在研究用戶使用生成式人工智能的過程中積累到了非常寶貴的研究經驗,后續可以基于日記收集用戶與 Gen AI 成功對話的案例,開展更加深入的數據分析工作,例如從文本提示詞重構等方面來挖掘更多內容,也可以進一步分析群體特性、任務屬性以及情境等影響因素,以探討它們如何影響人們與生成式人工智能的交互行為和交互體驗。

王俊;謝青伶;劉暢,北京大學信息管探系,202502