在4月18日舉辦的2024中國生成式AI大會(huì)上,李未可科技正式發(fā)布為眼鏡等未來終端定向優(yōu)化的自研“WAKE-AI ”多模態(tài)大模型。
該模型圍繞GPS軌跡+視覺+語音打造新一代LLM-Based的自然交互,同時(shí)在多模態(tài)問答技術(shù)的加持下,具備文本生成、語言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力, 能實(shí)現(xiàn)所見即所問、所問即所得的精準(zhǔn)服務(wù)。此外,WAKE-AI還融合了人類意圖理解、長期記憶機(jī)制、情感大模型及TTS 克隆,可以為用戶提供超擬人的情感陪伴服務(wù)。
為保證實(shí)時(shí)交互場景的智能性及響應(yīng)速度 ,WAKE-AI使用了MOE架構(gòu),F(xiàn)lashAttention混合精度訓(xùn)練、知識(shí)蒸餾等技術(shù)大幅降低算力需求跟計(jì)算時(shí)間。該模型針對(duì)眼鏡端用戶的使用方式、場景等進(jìn)行了優(yōu)化,語音返回速度能做到<500ms以內(nèi),語音喚醒準(zhǔn)確度>90%,ASR字錯(cuò)率低于2%,可以為用戶提供戶外運(yùn)動(dòng)、文化旅行、日程管理及實(shí)時(shí)翻譯等多個(gè)室外場景的多模態(tài)AI服務(wù)。
據(jù)悉,李未可將于近期正式發(fā)布搭載WAKE-AI能力的新終端,從室外場景切入為用戶提供更智能、更全面的AI+服務(wù)。李未可科技合伙人&AI負(fù)責(zé)人古鑒表示,WAKE-AI將逐步開放平臺(tái)能力,便于更多企業(yè)及開發(fā)者調(diào)用WAKE-AI能力,共建AI+硬件生態(tài)。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息