久久久久久久999_99精品久久精品一区二区爱城_成人欧美一区二区三区在线播放_国产精品日本一区二区不卡视频_国产午夜视频_欧美精品在线观看免费

標題: 聆思CSK6大模型多模態語音交互開源SDK介紹 [打印本頁]

作者: ListenAI    時間: 2024-6-13 15:35
標題: 聆思CSK6大模型多模態語音交互開源SDK介紹
聆思CSK6大模型多模態SDK除了支持語音交互之外,還支持圖像方面的交互,包括對圖像的識別以及圖片生成。用戶可以通過語音交互、攝像頭拍照作為交互入口,實現與大模型的多模態交互。
SDK主要包含以下功能:
●語音交互:支持按鍵錄音或喚醒后通過語音與大模型進行對話
●拍照識圖:支持通過攝像頭拍攝圖像并上傳給大模型進行識別,支持依據識圖內容進行提問
●圖片生成:支持通過語音交互描述畫面內容,令大模型生成圖片并顯示至套件屏幕上
語音交互模式支持的語音交互模式
多模態SDK支持三種交互方式,其特點如下:
模式
喚醒方式
交互方式
按鍵交互
按下屏幕麥克風圖標或開發板K3按鍵
按住按鍵說話,松開提交
語音喚醒(單輪)
喚醒詞 “小美小美”
聽到提示音 “在呢” 后進行提問,每次提問均需要喚醒
語音喚醒(多輪)
喚醒詞 “小美小美”
聽到提示音 “在呢” 后進行提問,可持續對話,當超過20秒無語音輸入時自動結束本次交互
語音交互模式的切換
在待機頁面,下滑可調出下滑菜單,點擊下滑菜單中的 設置圖標,可進行配置頁面。
選中對應的模式后,點擊左上角即可回到待機頁面并生效。
按鍵交互模式
設置成按鍵交互(按鍵喚醒)模式下,按住屏幕上的麥克風按鈕或開發板上的K3按鍵,即進入錄音狀態,松開按鍵則結束錄音并提交。
語音喚醒模式
當設置為語音喚醒(單輪)或語音喚醒(多輪),可通過喚醒詞 —— “小美小美” 對設備進行喚醒,當聽到 “在呢” 的提示音后,即可正常進行語音輸入。
退出對話
在使用過程中,點擊左上角即可結束本輪對話回到待機頁面,此操作會同步清除本次對話的上下文信息。
拍照識圖
在待機頁,點擊拍照按鈕即可進入取景頁面,對準要拍照的物體,點擊右側中間的拍照鍵完成抓拍,確認畫面抓拍正常后(無晃動模糊的情況),點擊右側的 √ 進行提交識別。
文生圖
在設備進入語音交互狀態后,可以通過帶有繪畫意圖的提示詞讓大模型進行作畫,比如:
●“畫一只熊貓”(結果看下方圖片附件)
SDK資源下

熊貓.png (310.62 KB, 下載次數: 14)

熊貓.png





歡迎光臨 (http://www.zg4o1577.cn/bbs/) Powered by Discuz! X3.1
主站蜘蛛池模板: 成人a免费 | 欧美成人一区二区三区片免费 | 久热国产精品视频 | 中文字幕成人在线 | 99在线免费观看 | 久久三区 | 久久激情视频 | 黄色一级免费观看 | 国产亚洲成av人在线观看导航 | 国产一区二区在线免费播放 | 欧美日韩高清在线一区 | 国产一区日韩在线 | 日本人做爰大片免费观看一老师 | 又黄又色 | 中文字幕 在线观看 | 日日操操 | 亚洲国产精品一区二区第一页 | 特级a欧美做爰片毛片 | 日韩精品视频在线观看一区二区三区 | 91视频播放 | 日本大香伊一区二区三区 | 久久精品一 | 国产一区h| 久久久久国产精品一区二区 | 欧美一区二区三区在线观看 | 日韩视频精品在线 | 亚洲品质自拍视频网站 | 国产精品不卡 | 精品在线一区二区 | 美女国内精品自产拍在线播放 | 国产精品久久久久久久久久三级 | 九九综合 | 国产一区二区三区久久久久久久久 | 婷婷在线视频 | 午夜一区二区三区视频 | a级大片免费观看 | jizz视频| 最新中文在线视频 | 在线亚洲一区二区 | 波多野吉衣在线播放 | 成人免费在线电影 |