2024-03-28T11:50:18Z
https://kitami-it.repo.nii.ac.jp/oai
oai:kitami-it.repo.nii.ac.jp:00007607
2022-12-13T02:19:43Z
1:86
内耳の情報処理を模倣した音声信号収集システムの性能改善
Improvement of the Extremal Sampler System Modeled on Auditory Processing in the Inner Ear
Improvement of the Extremal Sampler System Modeled on Auditory Processing in the Inner Ear
吉田, 秀樹
中野, 正博
行正, 徹
福地, 博行
進藤, 覚弥
有田, 敏彦
鞘師, 守
前田, 康成
羽山, 雄偉
横野, 和也
open access
聴性情報処理
極値
最小二乗法
音声
サンプリング
auditory processing
extrema
least squared method
speech
sampling
先行報告した音声帯域(80-5,120Hz)のデータ収集システムの性能改善を実施した。同システムは従来のPCMデータを、6帯域に分割された時間-周波数平面を構成する極大値と極小値の時系列に変換し、聴性認識の研究や応用製品の開発に資することを目的とする。帯域制限波の極値の記録から元の音響情報は再生できるので、許容誤差内で高速に極値を記録することが課題であった。解決の鍵は極値を推定することに見出され、標本化周波数を従来値の44,100Hzから22,050Hzに下げたことで、より少ない入力データから情報抽出が実現し、計算時間の約67%が短縮された。さらに共有メモリの設計をブロック長16,384バイト、ブロック数2とし、3種類の汎用フォーマットを提案したことで、ファイル容量の約65%が削減され、6秒毎に出力されていたファイルが約1.5秒毎に生成できる様に改良された。
Estimation of the local maximal data in the band-limited waveform by using the least squared method has been a key technique in order to reduce processing time, especially for the six-channel finite-impulse-response filter-array on our proposed real-time acquisition system. According to our previous study, more than half of minimum data in the band-pass filtered waveform can be substituted by average of the contiguous maximum data, with achieving lower than 4% of phase error. Not only approximate 67% reduction of processing time but also less than half of file size, e.g., approximate 65% saving of 1-h speech data, has been attained, releasing three types of the. ext file format for the extremal data. Further, a design of shared memory has played on important role in performance of response on a single processor system of PC-AT compatible computer, offering that length and number of blocks, and sampling frequency were 16,384-byte, 2 and 22,050hz, respectively. We have improved the acquisition system for the speech bandwidth (80-5,120Hz), in which conventional pulse-code-modulated data series can be simply converted to the extremal data in the tem-pro-spectral domain, generating files every 1.5-s, for manipulation of fine acoustic structure, synthesis, succeeding processes for recognition and/or categorization, and so forth.
バイオメディカル・ファジィ・システム学会
2010-05
jpn
journal article
VoR
https://kitami-it.repo.nii.ac.jp/records/7607
バイオメディカル・ファジィ・システム学会誌
12
1
19
28
https://kitami-it.repo.nii.ac.jp/record/7607/files/No223.pdf
application/pdf
1.7 MB
2016-11-22