MS, 3초 길이 샘플만으로 음성 복제할 수 있는 AI VALL-E 소개
- 01-11
- 2,494 회
- 0 건
* VALL-E 공식 데모 페이지
* Microsoft's VALL-E can imitate any voice with just a three-second sample (Windows Central 기사)
마이크로소프트가 6만 시간의 영어 음성 데이터를 훈련시켜 사람 목소리를 그럴듯하게 복제하는 VALL-E라는 도구를 소개했습니다.
음성을 복제하는 데 3초 정도의 녹음본만 있으면 가능하다고 하며, 화자의 감정도 옮길 수 있다는 것이 타 AI와 다른 점이라고 합니다.
첫 번째 링크에 샘플이 공개되어 있는데, 악용을 우려한 것인지 일반적인 사용은 아직 불가능하게 되어 있습니다.