台灣數位出版聯盟 Taiwan Digital Publishing Forum TDPF: 【趨勢觀點】AI導入數位無障礙評估，為什麼專家說這是機會也是考驗？

編譯：余韋達

隨著數位科技日益深入生活的各個層面，確保所有人都能平等地使用數位服務已成為現代社會的重要課題。一場由 W3C Web 無障礙倡議單位（W3C Web Accessibility Initiative）所主辦的國際線上研討會，匯集了來自學術界、產業界、政府部門的代表，以及身心障礙人士，共同探討評估數位無障礙發展的三大關鍵領域：數位無障礙的培訓、行動裝置的無障礙狀態，以及人工智慧的應用。

本文將聚焦在由三星研發中心英國分部的馬修．艾金森（Matthew Atkinson）所主持的「用於無障礙程度評估的人工智慧」（Artificial Intelligence for Accessibility Evaluation）的專題討論內容。參與本次專題討論的專家們指出，雖然人工智慧技術為數位無障礙程度的評估帶來新的可能性，但也存在諸多爭議與挑戰。來自土耳其中東科技大學的葉利茲．葉希拉達（Yeliz Yesilada）強調，人工智慧並非萬靈丹，無法完全取代人工的評估，但在特定領域確實能提供重要輔助。同時，盧森堡政府資訊與新聞處的阿蘭．瓦格納（Alain Vagner）則從公部門的角度，提出了對人工智慧工具透明度、可問責性等關鍵要求。

這場研討會不僅展現了數位無障礙程度評估的最新發展，更凸顯出在人工智慧時代，如何有效運用新技術來促進數位平權，同時避免產生新的歧視與排除，已成為產官學界共同關注的重要課題。

既有自動化評估工具效能有限，AI技術引發新期待

網頁無障礙程度的評估長期以來主要仰賴人工審查，專業的評估人員需要針對網站或應用程式進行全面性的檢測。然而，隨著數位內容的快速增長，純人工評估的作業面臨越來越大的挑戰。根據研討會中的專家指出，目前的自動化評估工具僅能檢測到約 30% 的無障礙問題，這些工具主要採用標準的啟發式評估（heuristic evaluation）規則，而非機器學習技術。

這種有限的自動化程度，雖然能為評估工作提供初步的參考指標，但仍無法完全掌握網頁的無障礙性。正如馬修．艾金森所強調，現有的自動化工具主要用於提供粗略的估計，讓評估人員對網站的無障礙程度有基本認知。然而，這些工具往往無法處理需要理解內容脈絡的複雜問題。

專家們也提到，在進行網站評估時，如何選擇適當的取樣頁面是一項極具挑戰性的工作。特別是對於大型網站而言，如何在有限的評估預算下，確保選到具有代表性的頁面進行測試，會是相當關鍵的問題。這正是人工智慧技術可能帶來突破的領域之一：透過機器學習演算法，有望協助評估人員更有效地進行頁面採樣。

然而，專家們也警告，在運用人工智慧技術時必須謹慎，避免產生「負擔轉移」（burden shifting／shifting the burden）的問題。例如，在自動產生的字幕中，如果資訊不夠準確，反而可能將驗證字幕正確性的負擔轉嫁到最無法進行驗證的聽障使用者身上。這凸顯出在導入新技術時，必須謹慎評估其實際效益與潛在風險。

AI 輔助無障礙評估新突破，機器學習最佳化採樣流程

在研討會中，專家們分享了人工智慧技術在無障礙評估領域的多項潛在應用。葉利茲教授介紹了其團隊開發的「Optimal-EM」方法，這是一套運用機器學習技術輔助網頁取樣的創新方案。該方法透過無監督學習技術，根據頁面的複雜度、更新頻率、使用量等多項指標，協助評估人員選擇具代表性的樣本。

在複雜結構的識別上，人工智慧也展現出獨特優勢。例如在表格結構的評估中，機器學習的演算法可以協助判斷表格是用於資料呈現還是版面配置，這對於使用螢幕朗讀軟體的視障使用者來說極為重要。同時，人工智慧在自動生成替代文字、影片字幕等領域也有重要應用。

多語言支援是另一個關鍵應用領域。以盧森堡為例，由於官方語言包括德語、法語和盧森堡語，政府網站經常出現多語言混合的情況。這種複雜的語言環境對於無障礙程度的評估帶來特殊挑戰，例如需要確保不同語言的內容都有適當的語言標記，以便螢幕報讀軟體能正確發音。

專家們強調，這些應用主要著重在輔助而非取代人工評估。葉利茲特別指出，人工智慧技術可以在兩個層面提供協助：一是測試階段的自動化評估，二是在內容製作階段提供即時指導。這種「人機協作」的模式，有望大幅提升無障礙評估的效率和準確性。

AI 無障礙評估面臨的挑戰，小語種支援待突破

在人工智慧輔助無障礙評估的發展過程中，專家們指出了多項亟須克服的挑戰。首要問題是訓練資料的品質與取得。阿蘭．瓦格納表示，雖然盧森堡政府每年進行超過一百份的無障礙稽核報告，並將這些資料以開放授權的方式發佈，但這些資料是否足以訓練出有用的人工智慧模型，仍需要更多專業評估。

準確度與可靠性的問題同樣受到關注。以自動字幕生成為例，現有技術在處理小語種時往往面臨挑戰。盧森堡的經驗顯示，主流平台能夠支援德語、法語的自動字幕，但對於僅有四十萬使用者的盧森堡語，則往往無法提供有效支援。這突顯出人工智慧模型在處理資料量較少的應用場景時的侷限性。

背景脈絡的理解是另一項重大挑戰。葉利茲教授指出，即使是在表格結構的識別這樣相對明確的任務中，要讓機器理解內容的語境仍然十分困難。這種困難不僅存在於技術層面，更涉及到如何確保演算法能夠理解不同使用者的需求與使用情境。

此外，專家們也特別提醒，必須警惕人工智慧系統可能帶來的偏見問題。例如，如果訓練資料中某些類型的障礙者資料較為不足，可能導致系統在處理這些群體的需求時表現不佳。這凸顯出在開發人工智慧工具時，需要確保各類使用者群體都能得到平等的重視。

從盧森堡政府的實例，看 AI 評估工具的關鍵準則

作為公部門的無障礙評估專家，阿蘭．瓦格納在研討會中提出了一套評估人工智慧工具的關鍵準則。首要條件是透明度，特別是在公部門的應用場景中，必須能夠清楚說明系統是如何被訓練的，以及訓練資料的來源。這不僅關係到系統的可信度，更攸關對於潛在偏見的識別與防範。

在效能指標方面，專家們特別強調兩項關鍵指標：檢測率與誤判率。檢測率反映系統能夠發現多少實際存在的無障礙問題，而誤判率則顯示系統錯誤標示無障礙問題的比例。這兩項指標的平衡，直接影響工具在實務應用中的實用性。

可問責性是另一項重要準則。瓦格納強調，在公部門的環境中，每個決策都必須能夠解釋其來源是什麼。這意味著人工智慧系統不能僅是一個「黑盒子」，而必須能夠提供其判斷的理由。同時，系統的錯誤不能成為規避責任的藉口，機構仍需對身心障礙者負起確保數位服務可及性的責任。

特別值得注意的是，專家們強調在開發這類工具時，必須避免「障礙威脅」（disability danger）的風險。這個由莉茲．傑克森（Liz Jackson）提出的概念──她是「障礙名單」（Disabled List）的創始成員，一個由身心障礙者主導的設計團體組織──指出許多科技解決方案往往未能在開發過程中納入身心障礙者的意見，因而無法真正滿足其需求。這突顯出在開發無障礙評估工具時，必須確保身心障礙者能夠實質參與設計過程。

盧森堡政府的無障礙評估經驗，為我們提供了人工智慧應用的具體案例。作為一個多語言國家，盧森堡的公部門網站必須同時支援德語、法語和盧森堡語，這形成一項獨特的挑戰。瓦格納指出，由於當地民眾習慣在同一段文字中混用多種語言，這些內容必須有正確的語言標記，才能確保螢幕朗讀軟體使用適當的語音合成系統。

在文件無障礙化的面向，PDF 文件的自動標記是一個重要應用領域。根據盧森堡政府的統計，在該國 20 個最大的政府網站中，約有 60% 的 PDF 文件存在無障礙問題。雖然目前市面上已有運用人工智慧的自動標記工具，但瓦格納表示，這些工具在處理複雜版面、識別標題層級、判別裝飾性元素等方面的表現仍有待改進。

自動字幕生成的語言支援則反映出人工智慧應用的另一個實際限制。主流平台能夠支援德語和法語的自動字幕服務，但對於僅有四十萬使用者的盧森堡語，則往往無法提供有效支援。更具挑戰性的是處理在同一影片中交替使用多種語言的情況，這需要更複雜的語言識別和處理能力。

此外，考慮到聽障社群的特殊需求，政府也致力於推動簡易語言（Easy Language）的應用。瓦格納指出，這不僅有助於聽障者理解內容，也能幫助認知障礙者與非母語使用者。這突顯出在發展人工智慧解決方案時，需要考慮到不同使用者群體的多元需求。

AI輔助無障礙評估新方向，專家倡議人機協作模式

研討會的討論明確指出，人工智慧應被視為輔助工具而非完全替代人工評估的解決方案。葉利茲強調，即使是最先進的人工智慧技術，也需要具備無障礙專業知識的人員參與開發和應用。這些專家必須深入理解身心障礙者的需求，並將這些理解轉化為演算法可以處理的形式。

在標準規範方面，專家們一致認為，無障礙規範（如《WEB內容無障礙規範，WCAG》）在人工智慧的時代仍然不可或缺。瓦格納從法規遵循的角度指出，這些規範不僅是評估的依據，更是建立統一市場的基礎。即使是在人工智慧開發網站的未來，這些標準仍將扮演確保可及性的關鍵角色。

馬修．艾金森特別提到，W3C 已經開始著手制定機器學習的倫理原則，並成立「邊緣無障礙社群小組」（Accessibility at the Edge Community Group），致力於建立業界對人工智慧應用的共識。這些努力顯示出國際組織正在積極為人工智慧的無障礙應用建立規範框架。

展望未來，專家們建議應該著重發展「人機協作」模式，讓人工智慧在適當的時機提供協助。例如，在內容製作階段提供即時建議，或在評估採樣時提供統計分析支援，而將需要理解內容脈絡的判斷留給人類專家。這種協作模式既能發揮技術優勢，又能確保評估品質。

AI 輔助無障礙評估未來可期，專家：核心仍是以人為本

這場國際研討會的專題討論，為數位無障礙程度評估的未來發展勾勒出清晰的願景。專家們一致認為，雖然人工智慧技術帶來諸多可能性，但最重要的是維持「以人為本」的核心理念。正如參與討論的專家所強調，任何技術解決方案都必須確保身心障礙者的實質參與，避免淪為純粹的技術展現。

研討會同時凸顯出跨領域合作的重要性。要有效運用人工智慧技術，需要結合無障礙專業知識、機器學習技術，以及實際使用者的經驗。葉利茲特別指出，未來需要更多同時具備演算法開發能力和無障礙專業知識的人才，才能開發出真正有效的解決方案。

在監管與標準制定方面，瓦格納分享的盧森堡經驗提供了重要啟示。作為歐盟網頁無障礙規範的實行人士，他強調法規標準不僅是確保品質的工具，更是推動市場發展的重要動力。這反映出在技術快速發展的同時，完善的規範體系仍然不可或缺。

最後，研討會的討論也指向一個更深層的願景：透過審慎運用人工智慧技術，我們不僅能提升無障礙評估的效率，更能為建立一個更包容的數位社會奠定基礎。但這需要產官學界的持續努力，以及所有利害關係人的積極參與，才能真正實現。

圖片來源：https://unsplash.com/photos/two-hands-touching-each-other-in-front-of-a-pink-background-gVQLAbGVB6Q

Photo by Igor Omilaev on Unsplash