基于通義千問Qwen-VL、OCR等系列模型打造。

國(guó)內(nèi)首款A(yù)I助盲眼鏡發(fā)布,可實(shí)現(xiàn)避障、找物讀物、語音助手等功能

2025-12-04 11:40:30發(fā)布     來源:多知    作者:Mint  

  多知12月4日消息,杭州瞳行科技公司于本周正式發(fā)布國(guó)內(nèi)首款A(yù)I助盲眼鏡。

  據(jù)介紹,該眼鏡基于通義千問Qwen-VL、OCR等系列模型設(shè)計(jì),具有出行避障、找物讀物、語音助手和一鍵求助親友等功能。

  具體來看,瞳行將自研視覺模型與通義千問結(jié)合,配合121度超廣角雙攝像頭等硬件,著重打造低延時(shí)避障能力,并根據(jù)不同場(chǎng)景對(duì)模型進(jìn)行針對(duì)性調(diào)優(yōu)。

  在出行場(chǎng)景,該眼鏡可實(shí)現(xiàn)300ms的超低延遲,相當(dāng)于每邁出一步,眼鏡即可給出道路提示。

WechatIMG7448.png

  據(jù)統(tǒng)計(jì),我國(guó)現(xiàn)有視障人士超1700萬,由于缺乏除盲杖以外的高效輔助工具,出行高度依賴人工,導(dǎo)致許多視障者選擇“少出行”。

  杭州瞳行科技公司市場(chǎng)及技術(shù)總監(jiān)陳剛表示:“大模型出現(xiàn)之前,做AI助盲產(chǎn)品比較難。一方面,算力成本是目前的十倍左右。算力成本的大幅降低,讓AI初創(chuàng)企業(yè)能夠快速發(fā)展起來;另一方面,有了通義千問,我們通過基模復(fù)用+微調(diào)優(yōu)化即可快速實(shí)現(xiàn)所需功能。”

  該眼鏡由眼鏡主體、手機(jī)、遙控指環(huán)、盲杖四部分組成,目前已正式面市。