人工智能應用一般分為圖像處理,音視頻處理,以及文字處理這三大類。這里主要介紹音視頻處理在不同場景下的應用。
【視頻人臉融合】
視頻人險勝合功能,可以幫助用戶在獲得授權的前提下,將視頻中的指定的某個人臉替換成你想要的人臉。
【視頻人像卡通化】
根據輸入的人像視頻進行卡通化轉換,返回風格化后的視頻結果,支持日漫。
【視頻畫幅變換】
可以將輸入視頻通過智能裁切和填充輸出任意分辨率的視頻。
【視頻字幕擦除】
擦除視頻中的"標準"字幕,如電影電視劇中下方的白色字幕。
【視頻校色】
輸入一組視頻,輸出一組調色后的視頻。可根據視頻之間的相似性進行關聯調色。
【SDR轉HDR】
SDR轉HDR可將普通SDR視頻轉化為HDR視頻,以提供更高品質的視頻。
【視頻人像增強】
基于GPEN人像增強模型,對視頻中的人臉進行清晰度提升,顯著增加面部細節。
【視頻障噪】
基于多幀修復模型,對視頻中的各類噪聲信息進行降低,同時保持幀間的穩定性。
【物體檢測】
檢測圖像中的物體。可識別90類物體,例如:人體、椅子、籃球、摩托車等。
【白底圖檢測】
檢測輸入圖片背景是否為白底圖。
【貓鼠識別】
基于視覺AI算法、物聯網、大數據分析技術,檢測場景中是否有貓、老鼠等動物。
【著裝檢測】
基于視覺AI算法、物聯網、大數據分析技術,檢測指定場景范國內的人員穿戴情況。
【呼叫中心】
智能外呼、音頻質檢與分析等語音解決方案.
【語音數字大屏】
提供智能化可交互的語音數字大屏解決方案。
【智能語音會議】
助力節省會議紀要人力成本,提高工作效率。
【智能語音指令】
智能一體化系統,適用于手機APP/大屏指令交互。
【語音合成】
提供高度擬人、流暢自然的語音合成服務。
【語音識別】
將語音快速準確識別為文字,支持各類場景。
【定制音庫】
打造高還原、高清晰、高穩定的音庫定制服務。
【有聲閱讀】
支持多角色多情感與個性化音庫定制。