WEKO3
アイテム
人工的に拡張されたデータセットを用いた日本語感情音声合成
https://doi.org/10.19000/0002000840
https://doi.org/10.19000/0002000840bc4a55b6-7e31-473a-81d8-e62aec53c450
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 学位論文 / Thesis or Dissertation(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-05-27 | |||||||
| タイトル | ||||||||
| タイトル | Emotional Text-To-Speech in Japanese Using Artificially Augmented Dataset | |||||||
| 言語 | en | |||||||
| タイトル | ||||||||
| タイトル | 人工的に拡張されたデータセットを用いた日本語感情音声合成 | |||||||
| 言語 | ja | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| 資源タイプ | ||||||||
| 資源 | http://purl.org/coar/resource_type/c_db06 | |||||||
| タイプ | doctoral thesis | |||||||
| ID登録 | ||||||||
| ID登録 | 10.19000/0002000840 | |||||||
| ID登録タイプ | JaLC | |||||||
| アクセス権 | ||||||||
| アクセス権 | open access | |||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||
| 著者 |
KHALIFAH, MUJAHID, JAMAL, A
× KHALIFAH, MUJAHID, JAMAL, A
|
|||||||
| 抄録 | ||||||||
| 内容記述タイプ | Abstract | |||||||
| 内容記述 | This study explores the feasibility of using artificial emotional speech datasets generated by existing artificial voice-generating software as an alternative to human-generated datasets for emotional speech synthesis. Focusing on the Japanese language, we assess the viability of these artificial datasets in languages with limited emotional speech resources. Our approach combines qualitative and quantitative analyses to evaluate the effectiveness of synthetic emotional speech in replicating human-like emotional expression. The results demonstrate that while artificial datasets can approximate certain emotional states, there are significant limitations in replicating the full range of human emotions, particularly in subtle or mixed emotions. These findings underscore the potential and current constraints of using artificial datasets in emotional speech synthesis, suggesting avenues for future research to enhance the quality and emotional expressiveness of synthetic speech. | |||||||
| 言語 | en | |||||||
| 抄録 | ||||||||
| 内容記述タイプ | Abstract | |||||||
| 内容記述 | この研究では、既存の人工音声生成ソフトウェアによって生成された人工的な感情音声データセットを、人間が生成したデータセットの代替として感情音声合成に使用する可能性を探ります。日本語に焦点を当て、感情音声リソースが限られている言語において、これらの人工データセットの有効性を評価します。本研究は、質的および量的分析を組み合わせて、人工的な感情音声が人間のような感情表現をどの程度再現できるかを評価します。結果として、人工データセットは特定の感情状態を近似できる一方で、特に微妙な感情や混在した感情の再現には大きな限界があることが示されました。この発見は、感情音声合成における人工データセットの可能性と現状の制約を浮き彫りにし、合成音声の品質と感情表現力を向上させるための将来の研究の方向性を示唆しています。 | |||||||
| 言語 | ja | |||||||
| bibliographic_information |
発行日 2025-03 |
|||||||
| 学位名 | ||||||||
| 言語 | ja | |||||||
| 学位名 | 博士(工学) | |||||||
| item_7_degree_grantor_61 | ||||||||
| 学位授与機関識別子Scheme | kakenhi | |||||||
| 学位授与機関識別子 | 10106 | |||||||
| 言語 | ja | |||||||
| 学位授与機関名 | 北見工業大学 | |||||||
| dissertation_number | ||||||||
| 学位授与番号 | 甲第220号 | |||||||
| item_7_text_66 | ||||||||
| 言語 | ja | |||||||
| 研究科・専攻名 | 生産基盤工学専攻 | |||||||
| 学位授与年月日 | ||||||||
| 学位授与年月日 | 2025-03-21 | |||||||