POSTED ON 2025-08-14
17 min read
(Paper Review) Moshi: a speech-text foundation model for real-time dialogue
Introduction ๊ธฐ์กด Speech-Text Foundation Model์ ๋ ๋ฆฝ์ ์์๋ค์ ํ์ดํ๋ผ์ธ์ ์์กดํจ. ํ์ง๋ง ์ด๋ฌํ ๊ธฐ์กด ๋ฐฉ์์ ์ค์ ๋ํ๋ฅผ ๋ชจ๋ฐฉํ๊ธฐ์๋ ํ์ฐธ ๋ค์ณ์ง๊ณ ์์ โ ์ด๋ฅผ ๊ทน๋ณตํ ๋ชจ๋ธ โMoshiโ Speech-to-Speech ์์ฑ ...
#audio_paper_review
#AI
#Paper_review