MN_RPT
요약 정보
국가 | China | 장르 | 신기술 융합콘텐츠 |
---|---|---|---|
구분 | 상세 | (-) |
상세 정보
AI 기반 전방위 음성 인터랙션, 중국 소셜 플랫폼 SOUL 의 새로운 시도
음성 중심 AI 인터랙션은 XR·메타버스 시대의 핵심 요소로, 이번 사례는 중국의 실시간 상호작용형 콘텐츠 기술 발전을
이해하는 데 유용하다. 특히 메타버스 AI 아바타 분야에 관심 있는 국내 관계자들에게 직접 참고가 될 수 있다.
중국 소셜 플랫폼 SOUL은 ‘2025 세계 인공지능 대회(WAIC)’에서 자체 개발한 전방위 AI 음성 인터랙션 모델을 공개하였다.
해당 모델은 VAD(음성활성탐지) 없이 사용자 발화의 흐름과 맥락을 실시간으로 파악하고, 대화 중에도 음성과 감정을 반영한
상호작용이 가능하도록 설계되었다. AI는 사용자 환경, 시간, 상황에 따라 반응을 조절하며, 실제 사람처럼 대화에
개입하거나 감정적인 표현을 가미해 소통의 자연스러움을 높인다. 본 기술은 1:1 매칭, 그룹 파티, 가상 아바타 대화 등
다양한 소셜 기능에 접목될 예정이다. 이와 같은 실시간 음성 기반의 감정 인식 및 대화 주도 기능은 향후 AI 소셜 생태계의
확장 가능성을 보여준다.
▪ AI 소셜 플랫폼 고도화 사례
기존의 텍스트 기반 인터랙션을 넘어 음성 기반 실시간 AI 상호작용이 구체화되고 있다는 점에서, 향후 메타버스 내
AI 아바타 기술 발전 방향을 가늠하게 한다.
▪ 멀티모달 기반 상호작용 기술의 진화
시간, 환경, 발화 내용 등 다양한 정보를 실시간으로 감지·분석해 대화에 반영하는 멀티모달 구조는 국내 콘텐츠
서비스에도 적용 가능한 고도화된 설계 방향으로 참고할 만하다.
출처
华尔街见闻(WallstreetCN). (2025. 8. 1)
https://wallstreetcn.com/articles/3752449