摘要— 本文提出了一種新穎的度量方法,從心電圖和皮膚電活動信號中提取特征,以近乎實時地將每位觀眾的反應量化為無、中等和高。該度量方法直觀,并且與生物特征數據的手動編碼結果吻合良好。該度量方法有效性和可靠性的初步證據來自一系列使用不同刺激(即體育賽事;廣告;情景喜劇)和不同參與者群體(N=231)的研究。本文還討論了這種方法在多種用途上的實用性。
關鍵詞— 媒體研究,生理信號,心率,皮膚電導,拐點,信號處理,自適應閾值。
I.引言
情感反應可以廣義地定義為對特定內心感受的反應,伴隨著可能或可能不外顯的生理變化。簡而言之,情感涉及生理喚醒和認知歸因(即標簽化)。情感喚醒涉及自主神經系統活動的變 化。自主神經系統是一個通用生理系統,負責調節外周功能,如心率和呼吸節奏[1]。該系統由交感神經和副交感神經分支組成,通常分別與激活和放松相關。由于ANS的通用性,其活動并不僅僅是情感反應的功能,還涵蓋了與消化、穩態、努力、注意力等多種其他功能。
ANS激活的常用評估指標基于皮膚電(即汗腺)或心血管(即血液循環系統)反應。皮膚電活動是人體導致皮膚電特性持續變化的屬性。EDA的測量,通常稱為皮膚電導,由交感神經活動自主調節,交感神經活動在潛意識層面驅動人類行為、認知和情感狀態。SC為自主情緒調節提供了直接的洞察。Najstr?m和Jansson [2] 研究了在壓力事件后,對掩蔽威脅圖片的皮膚電導反應性對情感反應的預測價值。EDA可用于索引幾種不同的過程,如激活、注意力以及任務重要性或刺激的情感強度[3]。Simons等人[4]表明,與低喚醒度圖像相比,高喚醒度圖像引 發的SC反應更大。Hubert和de Jong-Meyer [5]也發現,一部10分鐘的卡通片誘發了一種愉快的愉悅狀態,其特征是低水平的喚醒和SC的快速下降。相比之下,一部懸疑片則導致放松感減 少,喚醒度增加,表現為SC的顯著增加。
用于研究情感反應的心血管指標包括心率、血壓、總外周阻力、心輸出量、射血前期和心率變異性。HR和BP反映了交感神經和副交感神經活動的結合,而HRV與副交感神經活動密 切相關[6]。Choi等人[7]建議僅在視覺刺激誘發高度情緒時才使用基于HRV的評估。De Jonckheere等人[8]表明,基于HRV的度量可以很好地指示情感情境中的副交感神經變
化。Appelhans和Luecken [9]為使用HRV作為個體情緒反應調節差異的指標提供了理論和實證依據。HRV是一種易于使用的研究工具,可以增進對情感在社會和心理病理過程中作用的理解。
研究人員已將ANS輸出整合到關注對各種刺激和媒體的情感反應的研究中。Detenber等人[10] 借助主觀測量和生理數據(SC和HR)研究了圖像運動對個體情感反應的影響。Renaud和Blondin [11]測量了心率、皮膚電導反應頻率和自我報告,以研究參與者在執行計算機版Stroop 色詞干擾測試期間的焦慮水平。
作為一種廣告媒介,電視具有許多優勢,例如視聽沖擊力強、地理覆蓋范圍廣、目標選擇精準以及受眾覆蓋面廣[12]。為了確保這些優勢,需要大量的資金投入。例如,2018年超級碗30秒廣告的平均價格超過500萬美元[13]。因此,為了這些收益并最小化財務浪費,廣告從業者和研究人員一直關注電視廣告的效果。多篇文章表明,可以通過監測神經生理參數來研究廣告的效
果。Siefert等人[20]在2008年超級碗期間收集了生物特征數據,并研究了生物特征測量在評估消費者對廣告內容的情感投入方面的效用。Ohme等人[14]證明了神經生理測量可以捕捉消費者對略有不同的營銷刺激反應的差異。作者展示了觀眾對電視廣告中一個修改場景的神經生理反應存在顯著差異。Ravaja [15]概述了心理生理測量在媒體研究中用于注意力和情緒的應用,重點介紹了三種的測量方法:心率、面部肌電圖和皮膚電活動。Lang [16]通過分析心率數據,顯示了觀看商業信息的受試者的短期注意反應和長期喚醒。
評估ANS對刺激的反應的潛在益處幾乎沒有爭議。然而,此類研究的成本、時間和解釋難度嚴重限制了這些技術的應用。后者尤其令人煩惱,因為許多本可以從納入生理測量中受益的人,由于缺乏熟悉度、經驗或認為無法解釋數據輸出而避免使用它們。本文提出了一種新穎的度量方法, 用于基于受試者的心率和皮膚電導研究其情感反應,以解決這些問題。該度量可以實時生成,無需基線校準,直觀且易于解釋,并可用于在同一尺度上評估不同的刺激。
本文描述了該度量的計算方法、用于收集數據的系統,并展示了一系列證明該度量有效性和可靠性的研究。主要貢獻在于展示了一個能夠收集生物物理數據、計算非意識度量并實時、無需人工干預生成結果的系統。
四、試點觀察
通過一套精細而簡潔的編碼系統,我們將推導出的皮膚電導與心率變異性響應量化為情緒反應指標。皮膚電導響應分為三個等級:高正向趨勢、正向趨勢與拐點;而心率變異性響應為二元指標,即基于閾值處理的EBC值進行判定。
圖5中標示了皮膚電導的趨勢點與拐點示例:洋紅點標識正斜率的起始位點,綠點標記正向趨勢,紅點則顯示高正向趨勢。在大多數時間段內,心率變異性未出現劇烈波動,僅在某些區間呈現低值狀態——這意味著心率保持相對恒定,表明受試者正處于注意力集中狀態。
該受試者在多數時間都對刺激產生了反應。在30秒附近同時出現高正向皮膚電導趨勢與心率變異性響應, 故標記為高強度響應;同理,130秒附近同時出現的拐點與心率變異性響應也被歸類為高強度響應。其 余"常規響應"則由皮膚電導變化引起(即未伴隨相應的心率變異性響應)。
從圖5可清晰看出,受試者在前兩條廣告期間持續產生反應,而對后兩條廣告反應較弱(這與前文提及的消費者報告結論一致)。研究通常不局限于個體分析,通過計算響應觀眾占比即可實現全體受試者數據的聚合分析。如圖6所示,在35秒時點:起亞廣告引發100%觀眾響應,潔霸廣告為75%,《坦克世界》廣告為37.5%,肯德基廣告達62.5%。前兩條廣告的高強度響應觀眾比例顯著高于后兩條,這種觀眾比例時序圖能幫助研究人員直觀掌握多數受試者產生共鳴的關鍵時刻。
上述所有指標均支持實時計算,因為響應提取與分類算法僅依賴5秒時間窗口數據,而非全時段數據。這使得焦點小組主持人能實時定位廣告或其他刺激物中的興趣點,而非依賴事后獲取的自我報告。自我報告僅能提供對整體廣告的籠統評價,無法精準定位引發觀眾興趣的具體節點,且可能受到與刺激無關的外部因素干擾;而本算法檢測的生理參數變化則不受這些外部因素影響。
五、效度驗證研究
A.引言
本試點研究的主要目標是建立一套高度自動化的方法,將觀眾反應編碼為三個等級(即無響應、常規響應、高強度響應)。隨后我們開展了一系列后續研究以檢驗這些指標的效度。我們特別關注這些指標是否能真實測量情緒喚起水平—— 尋找一個的情緒喚起結果測量指標本身具有挑戰性。
所有數據集的"任意響應"均通過前述算法進行計算。在本文后續章節中,"任意響應"將統一簡稱為"響
應"。下一節將進行比較的不同刺激條件詳見表3所列。
B.討論
圖7匯總了表3所列各刺激條件的響應數據。水平條 形表示特定刺激條件的平均響應強度,垂直誤差線則表征樣本標準差(注:法國對秘魯的比賽中僅出現一次進球,故無法計算方差)。
我們針對測量指標提出六項可通過這些數據集驗證的假設,現將按預期效應強度逐條論述如下:
1.足球進球時刻的響應強度應高于比賽平均值。從直覺而言,進球時刻理應比足球比賽中的普通片段引發更強烈的反應。在兩場賽事中,對進球產生響應的觀眾峰值比例比比賽期間的平均響應高出四個標準差以上。若三個隨機樣本均出現超出均值三個標準差的情況,其概率僅約四億分之一。
2.超級碗達陣得分應高于比賽平均水平。同理,美式橄欖球中的達陣得分也比普通比賽片段更能引發情緒喚起。在2018年超級碗的143個比賽片段中
(含達陣、射門及其他非得分片段),觀眾平均響應率為44%(標準差14%)。其中監測到的7次達陣時刻,峰值響應觀眾比例達90%,超出比賽平均值3.2個標準差。
3.超級碗射門得分應低于達陣但高于比賽均值。這是因為射門得分值較低、通常經過預先布置(缺乏突發性),且基于踢球位置可預判結果。但作為得分方式,其重要性仍高于普通比賽片段。射門得分時的平均峰值響應率為64%,較比賽均值高1.4個標準差,但顯著低于達陣得分——這與預期吻合。該現象隨機發生的概率低于0.1%。
4.廣告響應強度應低于比賽本身。2018年超級碗比 賽期間觀眾平均響應率為44%,而廣告時段僅38%;法國-秘魯比賽響應率為38%,中場廣告僅30%;墨西哥-巴西比賽響應率49%,廣告時段48%。所有案例均顯示比賽響應 率略高于廣告,驗證了該假設。但差異幅度小于預期,可能是"關注廣告"的指令要求人為抬升了 廣告響應值。
5.法國-秘魯比賽的響應水平應低于墨西哥-巴西比賽。這一預期源于法國-秘魯比賽的受試者中缺乏雙方球隊擁躉,而墨西哥-巴西比賽則全部為墨西哥隊球迷。實際數據呈現顯著差異:法國-秘魯比賽平均響應率為38%,而墨西哥-巴西比賽達49%。該差異可能因法國-秘魯比賽精彩度不足而放大(事后多名受試者反饋該場比賽較為沉悶)。
6.體育賽事的平均響應水平應高于情境喜劇?;谑找曇幠Ec競爭賽事的本質屬性, 體育賽事理當比情境喜劇——尤其是一部收視慘淡、研究結束后即遭停播的劇集
——更能激發觀視興趣。數據支持該假設: 劇集響應觀眾比例均低于三項體育賽事。情境喜劇平均響應率為34%,而超級碗、法國- 秘魯、墨西哥-巴西的響應率分別為44%、38%和49%。
對這四項數據集的分析結果全面支持了所有六項先驗假設。這些發現有力印證了該響應指標具備以下特征:
1.能捕捉引發觀眾情緒喚起的關鍵時刻
2.可區分能引發情緒喚起的刺激與無效刺激
3.能量化觀眾群體中不同等級的情緒喚起強度
4.可在統一量綱下實現不同刺激源的比較評估
VI.可靠性
A.引言
本研究采用NeurolynQ系統對51名受試者進行監測,通過觀看標準20分鐘情境喜劇來量化算法的可靠性,并確定實 際研究場景中的樣本量需求。所有七場實驗均在標準化焦 點小組實驗室完成,單場參與人數介于4至10人之間(詳見表3)。受試者通過商場隨機招募獲得,人口學特征覆蓋廣泛:涵蓋18至60歲普通人群,男女均衡。
VII.總結與結論
本文提出了一種使用生理信號(ECG和EDA)來量化受試者情感反應(反應率度量)的信號處理方法。SC數據被分 類為3類之一:高正趨勢、正趨勢和拐點。IBI數據被轉換為HRV,并進一步標記為HRV反應。然后使用獨特而簡單 的編碼方案將SC和HRV反應轉化為情感反應。反應率度量具有一系列非常理想的功能特性,包括:
1.可以實時計算。
2.對研究人員來說直觀,并且貢獻可以追溯到個體 受訪者。
3.與數據的手動編碼結果吻合良好。
4.捕捉整個反應周期,而不僅僅是峰值。
5.可用于在同一尺度上比較不同的刺激。
通過將硬件、軟件和算法集成到一個系統中,研究人員能 夠在人們暴露于刺激時實時分析他們的情感反應。
為了評估有效性,作者分析了體育賽事,在這些賽事中可 以合理地假設觀眾對得分回合會有高反應。然后我們將此 分析擴展到其他刺激,包括廣告和電視情景喜劇。研究結 果支持了直觀的假設:
1.高興奮度得分回合(達陣和進球)的反應率比平
2.低興奮度得分回合(射門得分)的反應率比平均 值高出約1.4個標準差。
3.參與度較低的觀眾比參與度較高的觀眾反應率更 低。
4.電視廣告和情景喜劇的平均反應率低于體育賽 事。
最后,作者通過比較情景喜劇研究中的子樣本與全樣本來 評估了度量的可靠性。
聯系電話:86-027-87052487 | 傳真:86-027-87052487-8015 | 鄂ICP備17009301號-1 | 網后臺登錄
版權所有 武漢提沃克科技有限公司(m.mawklee.com)主營:顯微鏡熒光光源,菌落計數器,激發光源,示蹤儀,熒光顯微鏡等