Hitoshi Suda(須田 仁志)
Ph.D. in Engineering.
Publications
Theses / 学位論文
- 須田仁志.複数人歌唱楽曲に対する音楽情報処理に関する研究.東京大学大学院工学系研究科博士論文.2022年3月.[PDF]
- 須田仁志.歌声分析によるグループアイドルソングのパート割り構造認識に関する基礎的検討.東京大学大学院工学系研究科修士論文.2019年3月.[東京大学学術機関リポジトリ]
- 須田仁志.ソースフィルタ非負値行列因子分解を用いたボコーダフリー声質変換に関する研究.東京大学工学部電子情報工学科卒業論文.2017年3月.
Journal Papers
- Hitoshi Suda, Daisuke Saito, Satoru Fukayama, Tomoyasu Nakano, and Masataka Goto. Singer diarization for polyphonic music with unison singing. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 30, 2022. DOI: 10.1109/TASLP.2022.3166262. [IEEE Xplore]
- Hitoshi Suda, Gaku Kotani, and Daisuke Saito. INmfCA algorithm for training of nonparallel voice conversion systems based on non-negative matrix factorization. IEICE Transactions of Information and Systems, Vol. E105-D, No. 6, June 2022. DOI: 10.1587/transinf.2021EDP7234. [J-STAGE]
International Conferences (Peer-reviewed)
- Hitoshi Suda, Gaku Kotani, and Daisuke Saito. Nonparallel training of exemplar-based voice conversion system using INCA-based alignment technique. In Proc. the INTERSPEECH 2020, October 2020. DOI: 10.21437/Interspeech.2020-1232. [ISCA Archive, slides & demo]
- Gaku Kotani, Hitoshi Suda, Daisuke Saito, and Nobuaki Minematsu. Experimental investigation on the efficacy of Affine-DTW in the quality of voice conversion. In Proc. the 2019 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), November 2019. DOI: 10.1109/APSIPAASC47483.2019.9023107. [IEEE Xplore]
- Shunsuke Goto, Yuma Shirahata, Gaku Kotani, Hitoshi Suda, Daisuke Saito, and Nobuaki Minematsu. The UTokyo speech synthesis system for Blizzard Challenge 2019. In Proc. the Blizzard Challenge 2019 workshop, September 2019. [PDF]
- Hitoshi Suda, Daisuke Saito, and Nobuaki Minematsu. Voice conversion without explicit separation of source and filter components based on non-negative matrix factorization. In Proc. the Speech Synthesis Workshop 10, September 2019. DOI: 10.21437/SSW.2019-13. [ISCA Archive, poster (PDF), demo]
- Hitoshi Suda, Gaku Kotani, Shinnosuke Takamichi, and Daisuke Saito. A revisit to feature handling for high-quality voice conversion based on Gaussian mixture model. In Proc. 2018 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), November 2018. DOI: 10.23919/APSIPA.2018.8659658. [IEEE Xplore, slides (PDF)]
全国大会
- 今村奏海,増田尚建,須田仁志,齋藤大輔,峯松信明.自然音声の人工感を連続的に制御する技術の検討と評価.日本音響学会2022年春季研究発表会,2022年3月.
- 須田仁志,小谷岳,齋藤大輔.非負値行列因子分解による声質変換におけるINCAアルゴリズムをもとにした基底のノンパラレル学習法.日本音響学会2020年春季研究発表会,2020年3月.[論文PDF]
- 小谷岳,須田仁志,齋藤大輔,峯松信明.パラレルデータ声質変換の品質改善に向けたAffine-DTWの実験的評価.日本音響学会2019年秋季研究発表会,2019年9月.
- 須田仁志,小谷岳,高道慎之介,齋藤大輔.高品質声質変換のための特徴量分析再訪.日本音響学会2018年春季研究発表会,2018年3月.[論文PDF,ポスターPDF]
- 須田仁志,齋藤大輔,峯松信明.ソースフィルタ非負値行列因子分解によるボコーダを用いない声質変換の実験的検討.日本音響学会2017年秋季研究発表会,2017年7月.[論文PDF,ポスターPDF]
研究会
- 五来丈瑠,須田仁志,齋藤大輔,峯松信明.テキスト音声合成における劣化音声を活用したデータ拡充に関する検討.第127回音楽情報科学・第132回音声言語情報処理合同研究発表会(音学シンポジウム2020),2020年6月.[情報学広場]
- 山内孔貴,須田仁志,齋藤大輔,峯松信明.ソースフィルタ分解に基づく複数歌唱者の調和制御に関する検討.第127回音楽情報科学・第132回音声言語情報処理合同研究発表会(音学シンポジウム2020),2020年6月.[情報学広場]
- 須田仁志,小谷岳,高道慎之介,齋藤大輔.A revisit to feature handling for high-quality voice conversion based on Gaussian mixture model.第126回情報処理学会音声言語情報処理研究発表会(既発表セッション),2019年2月.[poster (pdf)]
- 須田仁志,深山覚,中野倫靖,齋藤大輔,後藤真孝.グループアイドルソングを対象とした歌唱者ダイアライゼーション手法の基礎的検討.情報処理学会音楽情報科学研究会第121回研究発表会,2018年11月.[情報学広場,ポスターPDF]
受賞等
- 情報処理学会音楽情報科学研究会第121回研究発表会学生奨励賞受賞(2018年11月)