송폼 = paragraph, not phrase
phrase: “구”, 문장.
핵심 내용
- Songform-aware Multi-level granularity syllable controlled lyric generation
- with arbitrary input text.
- Multi-level granularity lyric infilling
- Lyric correction experiments: generation ⇒ infilling
To the best of our knowledge, this is the first approach for lyric generation that controls songform and its syllable count in multi-level granularity.
Melody-to-lyrics 활발하게 연구되고 있는 중.
가장 핵심적인 것은 syllable control.
- 멜로디 - 가사 paired data도 별로 없음
단순 syllable control은 멜로디의 note수와 맞을 수는 있지만, 실제 생성된 샘플은 어색할 수 있음.
- 예를 들어, 총 생성된 음절 수는 같으나, 음악 멜로디의 phrase 단위와 실제 생성된 음절 수가 맞지 않아 실제 노래를 부를 시 어색할 수 있음.
- 따라서, 다양한 단위의 syllable control에 대한 필요성이 있음.
따라서, 우리는 다음과 같은 사항들이 가능한 모델을 제안
- Multi-level granularity syllable controlled generation
- Songform-aware full-song generation.
- 생성한 가사 수정을 위한 syllable controlled multi-granularity lyrics infilling.
- infilling 자체 모델 평가 및 실제 correction procedure experiments 수행.