第一屆 數位創新盃 全國電子書設計大賽

2024年2月27日

【趨勢觀點】W3C AI 與無障礙可及性研討會(下):自然語言如何讓網路更無障礙可及?

在前一篇報導中,我們整理了由 W3C 網路無障礙可及性倡議單位(W3C Web Accessibility Initiative)舉辦的線上研討會中,包容設計研究中心的總監 Jutta Treviranus 對於人工智慧對身心障礙人士帶來的挑戰與機會,以及三位專家對於電腦視覺在無障礙可及性的技術、法律與責任的議題。這篇報導則會聚焦在研討會另兩個討論自然語言處理(Natural Language Processing)的論壇:「自然語言處理與媒體的無障礙可及性」和「用於無障礙可及性溝通的自然語言處理」。

自然語言處理與媒體的無障礙可及性

在「自然語言處理與媒體的無障礙可及性」的論壇裡,非營利組織 Almpower.org Shaomei Wu 先分享從自然語言處理的角度,可以如何評估生成式內容的品質。Shaomei Wu 提到,替代文字的生成有兩個面向,首先是準確與否,再來是豐富與否。她提到現行網頁提供的替代文字相當有限,只會提供像是「人們微笑、披薩、室內」這樣簡短的內容,但這樣的描述無法說明這是怎樣的環境。然而對於許多用戶而言,他們其實更想要知道這張照片的脈絡與細節。Shaomei Wu 提出,或許未來可以提供一種漸進式的機制,開放用戶能要求提供更多系統無法提供的細節。而 mavQ Shivam Singh 則強調資料多樣性的重要性,並表示應該更仔細對資料進行分類,才能確保能提供更清晰的描述。Amy Pavel 則分享她觀察到目前使用自然語言處理來提升替代描述品質的幾個方式,其中一個是可以將要描述的影像與整體脈絡進行連結:譬如一張滑雪的照片,會因為貼文內容是「我學會一項新的運動」或「度假中!」而有不同的意義。另一種方式是訓練出一套模型,能夠蒐集使用者對於自然語言處理產出的替代文字的偏好,客製化未來的呈現結果。

這場論壇的另一個討論焦點是 ChatGPT 這套人工智慧服務所使用的大型語言模型技術,以及這項技術可以如何解決社會偏見。Shivam Singh 提到,因為目前用來訓練大型語言模型的大多數文本,都是來自於可以在網路建立資料的人,而透過這些內容訓練出來的模型,自然免不了會存在偏見,尤其是那些無法創造網路內容的身心障礙人士。因此,他認為除了在現有的訓練過程中,加入人類反饋的機制之外,也需要建立一套富有包容性的訓練流程,讓參與大型語言模型研究的所有人員,都能理解包容性的重要性。譬如 Google 就有一系列的工具,幫助開發者訓練出更具包容性的大型語言模型。

對於自然語言處理對於提升無障礙可及性的未來發展,Amy Pavel 認為可以結合電腦視覺來辨識影像中的內容,再利用自然語言處理的技術,根據使用者的偏好和他們想要的結果和脈絡,提供客製化的描述。Shivam Singh 則提到更加精良的自然語言處理技術,有機會讓具有眾多圖表與參考資料的學術教科書變得更可及。Shaomei Wu 表示,在未來自然語言處理的模型將不只能夠整合更多模態的資訊,提供更完整的替代描述;更重要的是,這套技術是否能幫助有視覺障礙的人,建立並分享他們的照片及影片。

用於無障礙可及性溝通的自然語言處理

研討會的最後一個論炭討論的重點是如何將自然語言處理的技術用於無障礙可及性溝通。來自 Southampton 大學的資深研究員 Chaohai Ding 表示,從他參與的幾個擴大輔助溝通系統(Augmentative and Alternative Communication systems,簡稱AAC 系統)的經驗來看,目前存在三個挑戰,一個是 AAC 系統缺乏足夠的資料,包含使用者資料、AAC 資料以及使用者如何與這套系統互動的資料,而這些資料的缺乏,也就無法開發出相對應的自然語言處理模型。另一個挑戰是 AAC 系統的符號集缺乏互通使用性(interoperability)。最後一個挑戰是包容性,也就是如何在不同的文化與社會脈絡下,考量不同使用者的需求。

來自馬德里卡洛斯三世大學的 Lourdes Moreno 則強調,我們需要解決語言模型的偏見,尤其是對身心障礙人士的偏見。目前在人工智慧領域,對於性別和族裔的偏見已經有不少著墨,但是對於身心障礙人士在語言模型中的偏見卻較少有討論。這樣的現象可能導致語言模型提供對身心障礙人士不利甚至冒犯的內容,所以會需要我們對此有進一步研究。 Old Dominion 大學的 Vikas Ashok 則討論到社群平台中,因為存在某些非正規的用語,對於身心障礙人士而言,即便他們可以「瀏覽」這些內容,但不代表他們能夠「理解」這些內容。

最後,關於自然語言模型在無障礙可及性溝通的未來發展,Vikas Ashok 認為我們會需要有更多針對無障礙可及性蒐集與規畫的資料集,再搭配訓練精良的大型語言模型,就有機會在這方面有所斬獲。而 Chaohai Ding 則提到自然語言模型和通用人工智慧模型,有機會提供更客製化的 AAC 符號與系統;而且加強不同溝通系統的互通使用性,讓不同溝通系統(語言、手語、AAC)能夠被翻譯,進而增加包容性。Lourdes Moreno 也表示,在未來除了希望有具包容性的模型之外,也能加強特定領域(譬如健康)內容的無障礙可及性,讓身心障礙人士能對相關資訊有深入的理解。

參考資料來源:https://www.w3.org/WAI/research/ai2023/

圖片來源:https://pixabay.com/zh/illustrations/ai-generated-robot-cyborg-robotics-8584133/
Photo by Vilius Kukanauskas onPixabay

沒有留言:

張貼留言