彩虹下載站

首頁 > 文章資訊 > 最新資訊

Facebook越來越擅長為視障用戶提供更多詳細(xì)信息

作者:佚名 來源:彩虹下載站 時(shí)間:2021-01-28

Facebook正在改進(jìn)其自動(dòng)替代文本(AAT)技術(shù),以更好地利用對象識別來按需生成照片描述。它將使盲人或視障人士能夠更好地了解新聞?dòng)嗛喸粗械膬?nèi)容。就上下文而言,AAT早在2016年就被引入,由于新的Facebook AAT可以識別1200多個(gè)概念,因此現(xiàn)在已提高了10倍。您在Facebook和In

Facebook正在改進(jìn)其自動(dòng)替代文本(AAT)技術(shù),以更好地利用對象識別來按需生成照片描述。它將使盲人或視障人士能夠更好地了解新聞?dòng)嗛喸粗械膬?nèi)容。就上下文而言,AAT早在2016年就被引入,由于新的Facebook AAT可以識別1200多個(gè)概念,因此現(xiàn)在已提高了10倍。

Facebook越來越擅長為視障用戶提供更多詳細(xì)信息

您在Facebook和Instagram上發(fā)布的每張照片均經(jīng)過圖像分析AI(即AAT技術(shù))評估,以創(chuàng)建標(biāo)題。它將信息添加到替代文本,該替代文本是圖像元數(shù)據(jù)中描述其內(nèi)容的字段:“站在田野中的狗”或“踢足球的人”。這使視障人士可以了解他們新聞?dòng)嗛喸瓷系膱D像。但是,人們不會為這些圖像添加這些描述。因此,F(xiàn)acebook正在通​​過培訓(xùn)AI來使其社交媒體更易于訪問。

Facebook越來越擅長為視障用戶提供更多詳細(xì)信息

AAT的最新迭代能夠以10倍以上的速度檢測和識別照片,從而減少了沒有描述的照片?,F(xiàn)在,它可以識別活動(dòng),地標(biāo),動(dòng)物類型等。例如,一張照片可能寫著:“可能是2人在戶外的自拍照,比薩斜塔。”

Facebook表示,這是業(yè)內(nèi)第一個(gè)在照片中包含元素位置和相對尺寸的信息。例如,AI不用說“也許是5個(gè)人的照片”,而是可以分析并指定在照片的中心有兩個(gè)人,而其他三個(gè)人則分散在邊緣,這意味著中心的兩個(gè)人是焦點(diǎn)。 。Facebook還補(bǔ)充說,它對模型進(jìn)行了訓(xùn)練,以預(yù)測圖像中對象的位置和語義標(biāo)簽。

Facebook越來越擅長為視障用戶提供更多詳細(xì)信息

AAT現(xiàn)在比以往任何時(shí)候都得到了改善

該公司利用對弱監(jiān)管數(shù)據(jù) 進(jìn)行訓(xùn)練的 模型,以數(shù)十億張公開Instagram圖片及其標(biāo)簽的形式進(jìn)行了AAT的最新迭代。它對所有地區(qū)的數(shù)據(jù)進(jìn)行了微調(diào),并沿性別,膚色和年齡軸評估了概念。結(jié)果,AAT現(xiàn)在變得更加準(zhǔn)確,在文化和人口統(tǒng)計(jì)學(xué)上都具有包容性。例如,它現(xiàn)在可以(部分)基于傳統(tǒng)服裝來了解和識別世界各地的婚禮。

Facebook詢問依賴屏幕閱讀器的用戶,他們想聽到多少信息,以及何時(shí)想聽到。并且得出一個(gè)結(jié)論,當(dāng)圖像來自朋友或家人時(shí),人們希望獲得更多信息,而當(dāng)圖像不是來自朋友或家人時(shí),人們希望獲得更多信息。 因此,默認(rèn)情況下,新的Facebook AAT可以為所有照片提供簡潔的描述,同時(shí)提供一種簡便的方法來獲取有關(guān)特定興趣照片的更詳細(xì)的描述。選擇后一個(gè)選項(xiàng)時(shí),它將顯示照片內(nèi)容的更全面描述。

它沒有詩意,但功能強(qiáng)大

 

AAT對它的默認(rèn)描述使用簡單的措詞,而不是冗長的句子。該公司表示,每個(gè)描述均以“可能存在”開頭,因?yàn)榇嬖谝欢ǖ恼`差,但“我們將標(biāo)準(zhǔn)設(shè)定得很高”。AAT替代文字說明有45種不同的語言版本,可供世界各地的人們使用。