OGIHARA Akio

Department of InformaticsProfessor/Dean

Last Updated :2024/07/20

■Researcher basic information

Degree

  • Doctor of Engineering(Osaka Prefecture University)

Research Keyword

  • 音楽電子透かし   音楽情報処理   音響信号処理   音声情報処理   情報セキュリティ   マルチメディア   視聴覚融合   画像処理   生体情報   個人認証   電子回路   

Research Field

  • Informatics / Perceptual information processing
  • Informatics / Sensitivity (kansei) informatics
  • Informatics / Intelligent informatics
  • Informatics / Soft computing
  • Informatics / Intelligent robotics
  • Manufacturing technology (mechanical, electrical/electronic, chemical engineering) / Electronic devices and equipment

■Career

Career

  • 2012/04 - Today  Kinki UniversityProfessor
  • 2007/04 - 2012/03  Osaka Prefecture UniversityAssociate Professor
  • 1999/04 - 2007/03  Osaka Prefecture UniversityAssociate Professor
  • 1995/04 - 1999/03  Osaka Prefecture UniversityAssistant Professor
  • 1992/04 - 1995/03  Osaka Prefecture UniversityResearch Associate

Educational Background

  • 1989/04 - 1992/03  Osaka Prefecture University  工学研究科  電気工学専攻(博士後期課程)
  • 1987/04 - 1989/03  Osaka Prefecture University  工学研究科  電気工学専攻(博士前期課程)
  • 1983/04 - 1987/03  Osaka Prefecture University  School of Engineering  電気工学科

■Research activity information

Paper

  • Kaho Yamamoto; Akio Ogihara; Harumi Murata
    Circuits systems and signal processing Springer birkhauser 42 (11) 7004 - 7021 0278-081X 2023/06 [Refereed]
     
    There has been much research on estimating noise and speech source direction, but there have not been many studies on estimating the source direction of instrumental sound sources. In this study, we considered the source direction estimation of a single instrumental sound. Direction estimation of sound sources by the multiple signal classification (MUSIC) method often causes large estimation errors. Then, we propose a technique for estimating the direction of musical instrument sound sources by applying regression analysis using a convolutional neural network (CNN), a type of neural network. We calculated the MUSIC spectrum obtained using MUSIC that uses the fundamental and harmonic components, which have relatively large amplitudes, and we estimated the direction of the sound source using the CNN with these components as input. We achieved this by focusing on the overtone structure of the instrumental sound source. This study demonstrated the effectiveness of this method using simulations in a monaural environment.
  • Direction estimation of sound source by MUSIC method and CNN considering overtone structure
    Kaho Yamamoto; Akio Ogihara; Harumi Murata
    Proc. 2022 International Technical Conference on Circuits/Systems, Computers and Communications 671 - 674 2022/07 [Refereed]
  • Direction estimation of sound source using MUSIC method and FFNN focusing on the overtone structure of instrumental sounds
    山本華帆; 荻原昭夫; 村田晴美
    電子情報通信学会論文誌 D J104-D (10) 780 - 783 2021/10 [Refereed]
  • Direction estimation of sound source using neural network in consideration of the overtone structure of instrument sound
    Kaho Yamamoto; Akio Ogihara; Harumi Murata
    Proc. 2021 International Technical Conference on Circuits/Systems, Computers and Communications 259 - 262 2021/06 [Refereed]
  • Note estimation by contaminated normal distribution for audio watermarking method using non-negative matrix factorization
    Harumi Murata; Ogihara Akio
    Proc. 2018 International Symposium on Intelligent Signal Processing and Communication 469 - 474 2018/11 [Refereed]
  • 村田晴美; 山本清高; 荻原昭夫; 目加田慶人
    電子情報通信学会論文誌 D J101-D (11) 1499 - 1503 1881-0225 2018/11 [Refereed]
  • 村田晴美; 荻原昭夫
    電子情報通信学会論文誌 D J101-D (1) 247 - 250 1881-0225 2018/01 [Refereed]
  • Harumi Murata; Akio Ogihara; Shigetoshi Hayashi
    IEICE Transactions on Information and Systems Institute of Electronics, Information and Communication, Engineers, IEICE E101D (1) 68 - 71 1745-1361 2018/01 [Refereed]
     
    We have proposed an audio watermarking method based on modification of sound pressure level between channels. This method is focused on the invariability of sound localization against sound processing like MP3 and the imperceptibility about slightly change of sound localization. In this paper, we investigate about tolerance evaluation against various attacks in reference to IHC criteria.
  • Kiyotaka Yamamoto; Harumi Murata; Akio Ogihara; Yoshito Mekada
    IEEJ Transactions on Electronics, Information and Systems Institute of Electrical Engineers of Japan 136 (12) 1661 - 1667 1348-8155 2016/12 [Refereed]
     
    This paper proposes a new regularization term of non-negative matrix factorization (NMF) for estimating pitch and onset time of electric bass. Both of them are indispensable information for automatic music transcription. However, it is difficult to estimate them from the electric bass performance because of trade-off problem between time resolution and frequency resolution. Applying the NMF simply to the electric bass performance, the correct note and its semitone are sometimes detected simultaneously. The proposed regularization term avoiding such miss detection based on the performance characteristic of the electric bass, that is, two notes are not generally played simultaneously. We define the regularization term in order to keep orthogonality of the adjacent activation decomposed by the NMF. As a result of the experiments using MIDI synthesizer-generated sound of electric bass and real played electric bass sound, it is confirmed that the F-measure of the proposed method is higher than that of comparative method.
  • Harumi Murata; Akio Ogihara
    ADVANCES IN INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING, VOL 1 SPRINGER INT PUBLISHING AG 63 107 - 114 2190-3018 2016/11 [Refereed]
     
    We propose a watermarking method using nonnegative matrix factorization (NMF) for audio signals. NMF is applied to the host signal, and the amplitude spectrogram of the host signal is factorized into the basis matrix and the activation matrix, which are nonnegative matrices. The notes are estimated from the activation matrix, and the estimated notes are regarded as root notes. In the existing method, one-bit watermark is embedded into the dominant note corresponding to the root note. However, it is difficult to say that the embedding capacity is enough. Hence, in the proposed method, watermarks are embedded into the mediant and leading notes in addition to the dominant note. Up to three-bit watermarks can be embedded into one note while maintaining a detection accuracy.
  • Harumi Murata; Akio Ogihara
    Proc. 2016 International Technical Conference on Circuits/Systems, Computers and Communications 677 - 680 2016/07 [Refereed]
  • Harumi Murata; Akio Ogihara
    2016 IEEE INTERNATIONAL SYMPOSIUM ON BROADBAND MULTIMEDIA SYSTEMS AND BROADCASTING (BMSB) IEEE 2155-5044 2016/06 [Refereed]
     
    In this paper, we propose an audio watermarking method using non-negative matrix factorization (NMF). The amplitude spectrogram of the host signal is decomposed the basis matrix and the activation matrix by NMF. These matrices are non-negative matrices and we use the activation matrix for embedding watermarks. Onset time and offset time are estimated from the coefficients of activation matrix and this interval is defined as note duration. The estimated notes are regarded as root notes and watermark are embedded by operating the activation coefficients of mediant or dominant note corresponding to root note.
  • Harumi Murata; Akio Ogihara
    2015 15TH INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS AND INFORMATION TECHNOLOGIES (ISCIT) IEEE 117 - 120 2015/10 [Refereed]
     
    A digital watermark is a technique to embed another digital data into digital contents such as music, image and movie. For audio signals, it is required that the sound quality of stego signal is not deteriorated. In existing methods, the high sound quality means that the difference between host signal and stego signal is small. On the other hand, in this paper, there is no problem even if a different sound from host signal is perceived as long as stego signal is maintained as music. Accordingly, we make a countermelody based on counterpoint and we propose a watermarking method that the countermelody is added to host signal as watermark signal. In this paper, we introduce not only chord tone but also nonharmonic note as an effective musical accent to watermark signal. Moreover, multiple notes can be arranged in one note of host signal, and it is expected to increase the embedding capacity of watermarks.
  • Harumi Murata; Akio Ogihara
    2015 INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING (IIH-MSP) IEEE 156 - 159 2015/09 [Refereed]
     
    For audio signals, the sound quality of the stego signal should not deteriorate as much as host signal. With current methods, high sound quality means that the difference between the host and stego signals is small. We proposed a method with which high sound quality means that the sound quality of the stego signal is maintained as music even if another sound, except for host signal, is perceived. Accordingly, we focused on the counterpoint of music theory. A watermark signal is added in consonance to the tones of the host signal based on counterpoint. For this study, we used a diatonic chord as consonance. We also used a sound with an instrumental timbre as the watermark signal. The sound quality of the stego signal does not produce an unpleasant feeling to the listener even if the watermark signal is perceived.
  • Sho Yamamoto; Tsukasa Hirashima; Akio Ogihara
    APPLIED COMPUTING & INFORMATION TECHNOLOGY SPRINGER-VERLAG BERLIN 619 101 - 112 1860-949X 2015/07 [Refereed]
     
    In this paper, we described about a design of learning environment based on information structure and a realization of problem posing for learning disability. We design and developed software by modeling information structure of subject that is operated on software. In this research, we aimed at the domain of education and developed a learning environment for posing arithmetic word problem. Problem posing is well-known as effective learning. But students who have learning disability are impossible to learn by this exercise because they cannot pose the problem from scratch and cannot read complex sentence. However, learner is able to pose a word problem by selecting three cards in our software. So we assumed that these learners are able to learn by problem posing by using our learning environment. Experimental use is also reported.
  • Harumi Murata; Akio Ogihara; Masaki Uesaka
    IEICE Transactions on Information and Systems Maruzen Co., Ltd. E98D (1) 89 - 94 1745-1361 2015/01 [Refereed]
     
    Yajima et al. proposed a method based on amplitude and phase coding of audio signals. This method has relatively high sound quality because human auditory property is considered for embedding. However, in this method, the tolerance to attacks tends to be weak. Hence, we propose a high-tolerance watermarking method using BCH code which is one of error correcting code. This paper evaluates whether our method preserves the sound quality while ensuring high tolerance.
  • Harumi Murata; Akio Ogihara
    2014 TENTH INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING (IIH-MSP 2014) IEEE 268 - 271 2014/08 [Refereed]
     
    In this paper, we propose an audio watermarking method using processed sound of music. For audio signals, watermarks are embedded in time domain or Fourier domain. In existing methods, it is required that noises are not perceived in stego signal. On the other hand, in the proposed method, there is no problem even if a different sound from host signal is perceived when stego signal is maintained as music. Accordingly, we use watermark signal which has same timbre as host signal by processing original music data itself. In this paper, we use pitch-transformed sound as processed sound of original music data and we intend to improve the subjective sound quality of stego signal.
  • Harumi Murata; Akio Ogihara; Shigetoshi Hayashi
    ISPACS 2013 - 2013 International Symposium on Intelligent Signal Processing and Communication Systems 51 - 54 2013/11 [Refereed]
     
    In this paper, we propose a new watermarking method based on modification of sound pressure level between microphones. We focus on two characteristics of sound source. One is location of a dominant sound source will be maintained even if signal processing like MP3 compression is performed. Two is deterioration of sound quality is imperceptible even if location of a dominant sound source is modified slightly. By using these characteristics, it is confirmed that we can embed the watermark information with high sound quality and high robustness to MP3 compression. Moreover, we confirm the validity of proposed method using music data having sparse representation. © 2013 IEEE.
  • Blind audio watermarking based on multiplicative patchwork method with extension of embedding region
    Harumi Murata; Akio Ogihara; Masaru Yamamoto
    Proc. 2013 International Technical Conference on Circuits/Systems, Computers and Communications 653 - 656 2013/07 [Refereed]
  • Application of synchronization code to multiple audio watermarking method based on average of absolute amplitude
    Akio Ogihara; Harumi Murata; Natsumi Kishimoto
    Proc. 2013 International Technical Conference on Circuits/Systems, Computers and Communications 657 - 660 2013/07 [Refereed]
  • An audio watermarking method based on modification of sound pressure level between microphones
    Harumi Murata; Akio Ogihara; Shigetoshi Hayashi
    Proc. 2013 International Technical Conference on Circuits/Systems, Computers and Communications 669 - 672 2013/07 [Refereed]
  • 村田晴美; 荻原昭夫; 岩田基; 汐崎陽
    電子情報通信学会論文誌 D 電子情報通信学会 J96-D (4) 941 - 951 1880-4535 2013/04 [Refereed]
  • Harumi Murata; Akio Ogihara; Motoi Iwata; Michifumi Yoshioka
    2012 International Symposium on Communications and Information Technologies, ISCIT 2012 99 - 104 2012/10 [Refereed]
     
    The objective of this work is to devise a new way to embed a watermark into digital audio signal. In conventional methods, it is required that the watermark is embedded without noise perception. However, it is difficult to embed the watermark without noise perception. Hence, we propose an embedding method so as to permit a perception of an embedded watermark signal. For watermarked audio signal, high sound quality is needed even if noises are perceived. Therefore, we estimate notes into music data and decide their timbre by musical instrument identification. Furthermore, for improving the sound quality, we embed one bit of watermark into one tone using the corresponding sampled sound for each tone. © 2012 IEEE.
  • Sound quality improvement by converting an embedding domain for blind audio watermarking based on multiplicative patchwork method
    Harumi Murata; Masaru Yamamoto; Akio Ogihara; Takeyuki Funabashi
    Proc. 2012 International Technical Conference on Circuits/Systems, Computers and Communications 2012/07 [Refereed]
     
    論文番号 D-W1-05
  • Relationship between GOS length and tolerance to MP3 in multiple audio watermarking method based on average of absolute amplitude and variance of amplitude
    Akio Ogihara; Natsumi Kishimoto; Harumi Murata
    Proc. 2012 International Technical Conference on Circuits/Systems, Computers and Communications 2012/07 [Refereed]
     
    論文番号 F-W1-05
  • An audio watermarking method based on musical instrument identification
    Harumi Murata; Akio Ogihara; Motoi Iwata; Michifumi Yoshioka
    Proc. 2012 International Technical Conference on Circuits/Systems, Computers and Communications 2012/07 [Refereed]
     
    論文番号 F-W2-01
  • An application of blind source separation to audio watermarking
    Akio Ogihara; Shigetoshi Hayashi; Harumi Murata
    Proc. 2012 International Technical Conference on Circuits/Systems, Computers and Communications 2012/07 [Refereed]
     
    論文番号 F-W2-03
  • A sound quality improve method for phase shift keying based audio watermarking considering masking curve
    Akio Ogihara; Masaki Uesaka; Shigetoshi Hayashi; Harumi Murata
    Proc. 2012 International Technical Conference on Circuits/Systems, Computers and Communications 2012/07 [Refereed]
     
    論文番号 F-W2-02
  • 振幅の増減に基づく音楽電子透かしにおけるリードソロモン符号を用いた音質改善法
    荻原昭夫; 井上尚也; 岩田基; 汐崎陽
    電子情報通信学会論文誌(A) J93-A (12) 835 - 839 2010/12 [Refereed]

Books and other publications

  • コンピュータネットワークの基礎
    共立出版株式会社 2005
  • コンピュータ通信とネットワーク(第5版)
    共立出版株式会社 2002
  • コンピュータ通信とネットワーク(第4版)
    共立出版株式会社 2000
  • コンピュータ通信とネットワーク(第3版)
    共立出版株式会社 1998
  • コンピュータ通信とネットワーク(第2版)
    共立出版株式会社 1995

Lectures, oral presentations, etc.

  • Effect of Increasing the Number of Sound Sources in Datasets in Deep Clustering on Sound Source Separation Accuracy for Instrumental Sounds  [Not invited]
    貞廣諒; 山本華帆; 村田晴美; 荻原昭夫
    電気・情報関連学会中国支部連合大会講演論文集  2023/10
  • Sound Source Separation for Instrument Sounds Using Deep Clustering  [Not invited]
    貞廣諒; 山本華帆; 荻原昭夫
    電気・情報関連学会中国支部連合大会講演論文集  2022/10
  • 楽器音源を対象とした方向推定手法の検討および比較  [Not invited]
    山本華帆; 荻原昭夫; 村田晴美
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2022/06
  • Estimation and Visualization of Degree of Excitement by Using Non-contact Vital Sensing
    森大星; 荻原昭夫; 井田真人; 山本華帆; 宮西宏和; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2020/10
  • Digital Watermark Method Considering Shift of Starting Point of Sampling Position for Acoustic Signal
    宮西宏和; 荻原昭夫; 山本華帆; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2020/10
  • Emotion Estimation When Listening to Music by Neural Network
    井田真人; 荻原昭夫; 山本華帆; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2020/10
  • 楽器演奏における初中級者を対象とした五線譜ベースの演奏表情付け学習支援システム
    平林慧太; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2019/10
  • バイタルセンシングを用いたリラクゼーション効果のある楽曲の特徴抽出
    井田真人; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2019/10
  • サラウンド音響空間の可視化を目的としたMUSIC法による仮想音源の方向推定
    山本華帆; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2019/10
  • スペクトル拡散法を用いた非接触型音響電子透かし手法の実環境における抽出精度評価
    宮西宏和; 荻原昭夫; 山本華帆; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2019/10
  • サラウンド音響におけるMUSIC法を用いた仮想音源位置の方向推定に関する検討
    山本華帆; 荻原昭夫; 村田晴美
    情報科学技術フォーラム講演論文集  2019/09
  • 山本華帆; 荻原昭夫; 村田晴美
    電子情報通信学会大会講演論文集(CD-ROM)  2019/03
  • 丸山貴大; 村田晴美; 荻原昭夫
    電子情報通信学会大会講演論文集(CD-ROM)  2019/03
  • サラウンド音響における色を用いた可視化の検討  [Not invited]
    山本華帆; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集  2018/10
  • 収音位置推定を目的とした音楽電子透かし法へのスペクトル拡散の適用性評価  [Not invited]
    赤尾大樹; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集  2018/10
  • 荻原昭夫; 村田晴美; 岡田名留美; 村本翔; 藤原礼奈; 山本華帆
    電子情報通信学会大会講演論文集(CD-ROM)  2018/03
  • 村田 晴美; 荻原 昭夫
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2018/01
  • ユーザ位置の推定を目的とした音楽電子透かし手法に関する研究  [Not invited]
    安原尚吾; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集  2017/10
  • スペクトル拡散を用いた音楽電子透かし法によるユーザ位置推定の検討  [Not invited]
    赤尾大樹; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集  2017/10
  • 山元翔; 荻原昭夫
    自動車技術会大会学術講演会講演予稿集(CD-ROM)  2017/10
  • 山本 清高; 村田 晴美; 荻原 昭夫; 目加田 慶人
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2017/03
  • 荻原昭夫; 村田晴美
    電子情報通信学会大会講演論文集(CD-ROM)  2017/03
  • 森川裕介; 村田晴美; 荻原昭夫
    電子情報通信学会大会講演論文集(CD-ROM)  2017/03
  • 村田 晴美; 荻原 昭夫
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2017/03
  • 村田 晴美; 荻原 昭夫
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2017/01
  • 村田 晴美; 荻原 昭夫
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2016/11
  • 宮原豪希; 山元翔; 荻原昭夫
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2016/10
  • 荻原昭夫; 安原尚吾; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2016/10
  • 大学講義における情報科目を対象とした部品組み立て型概念マップの実践事例  [Not invited]
    山元翔; 平嶋宗; 荻原昭夫
    平成28年度私立大学情報教育協会教育改革ICT戦略大会  2016/09
  • 村田晴美; 荻原昭夫
    電子情報通信学会技術研究報告  2016/09
  • 村田晴美; 荻原昭夫
    情報科学技術フォーラム講演論文集  2016/08
  • ARを用いたカーブの運転スキル学習支援システムの設計・開発  [Not invited]
    山元翔; 講元淳; 荻原昭夫
    2016年度人工知能学会全国大会  2016/06
  • 村田晴美; 荻原昭夫
    電子情報通信学会技術研究報告  2016/05
  • 荻原昭夫; 村田晴美
    電子情報通信学会大会講演論文集(CD-ROM)  2016/03
  • 村田晴美; 荻原昭夫
    電子情報通信学会技術研究報告  2016/02
  • 村田晴美; 荻原昭夫
    電子情報通信学会技術研究報告  2016/01
  • 山本清高; 村田晴美; 荻原昭夫; 目加田慶人
    電子情報通信学会技術研究報告  2015/12
  • 村田晴美; 荻原昭夫
    電子情報通信学会技術研究報告  2015/11
  • 藤木祥平; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2015/10
  • 番匠真; 荻原昭夫; 村田晴美
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2015/10
  • 宮原豪希; 山元翔; 荻原昭夫
    電気・情報関連学会中国支部連合大会講演論文集(CD-ROM)  2015/10
  • 鈴木啓太; 村田晴美; 荻原昭夫
    電気・電子・情報関係学会東海支部連合大会講演論文集(CD-ROM)  2015/09
  • 山本清高; 村田晴美; 荻原昭夫; 目加田慶人
    電気・電子・情報関係学会東海支部連合大会講演論文集(CD-ROM)  2015/09
  • 山元翔; 平嶋宗; 荻原昭夫
    情報科学技術フォーラム講演論文集  2015/08
  • 村田晴美; 荻原昭夫
    情報科学技術フォーラム講演論文集  2015/08
  • MURATA HARUMI; OGIHARA AKIO
    電子情報通信学会技術研究報告  2015/03
  • OGIHARA AKIO; MURATA HARUMI
    電子情報通信学会大会講演論文集(CD-ROM)  2015/02
  • MURATA HARUMI; OGIHARA AKIO
    電子情報通信学会技術研究報告  2015/01
  • 村田 晴美; 荻原 昭夫
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2014/11
  • Ogihara Akio; Murata Harumi
    Proceedings of the IEICE General Conference  2014/03
  • Ogihara Akio; Nakahara Daijiro; Tanaka Kazumoto; Tatsuno Junya; Takehara Shin
    Proceedings of the IEICE General Conference  2014/03
  • 村田 晴美; 荻原 昭夫; 上阪 昌毅
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  2014/01
  • OGIHARA Akio
    電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント  2013/11 
    The information hiding technology is classified into two categories: steganography and digital watermark. In the steganography, it is desirable to avoid feeling unnaturalness from stego-data. In the digital watermark, it is also desirable to avoid perceiving the influence of embedding process from stego-data. In the other words, it is important that users do not feel unnaturalness and a sense of incongruity from the stego-data processed by the information hiding technology. The quality of stego-data is often discussed technically by comparing stego-data with cover-data. For example, SNR and ODG are generally used as objective evaluation index in audio signal, and PSNR and SSIM are used in image and movie signal. On the other hand, cover-data are not always shown to users in the practical system applied the information hiding technology; rather, it is thought that cover-data are not shown in many cases. Therefore, for the purpose of getting natural feel from stego-data without unreasonable consideration of the difference between stego-data and cover-data, the audio watermarking method that applied music theory to information hiding is mentioned in this report.
  • MURATA Harumi; OGIHARA Akio
    電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント  2013/11 
    The objective of this work is to propose an embedding method using blind source separation. High sound quality is required even if a watermark is embedded in audio signal. For meeting this requirement, in this paper, we deal with music data not in terms of signal processing but in terms of music theory. For example, it is considered that sound quality is not annoying when a sound having similar timbre included in music data is added under certain conditions. However, if the sound does not become music by adding some sound source, there is something wrong. Hence, in this paper, we focus on consonance in music theory. Moreover, we propose an embedding method having high sound quality by adding watermark signal so that melody line and watermark signal become consonance.
  • Murata Harumi; Ogihara Akio
    情報科学技術フォーラム講演論文集  2013/08
  • Ogihara Akio; Tanaka Kazumoto; Tatsuno Junya; Takehara Shin
    Proceedings of the IEICE General Conference  2013/03
  • NISHIMURA Akira; OGIHARA Akio; UNOKI Masashi; KONDO Kazuhiro
    電子情報通信学会技術研究報告. EMM, マルチメディア情報ハイディング・エンリッチメント  2012/11 
    Technical committee on Information Hiding and its Criteria for evaluation (IHC) has established the first criteria for audio watermarking technology. A contest based on the criteria was held on 6 Sep. 2012. Six technologies of audio watermarking, including those which did not satisfy the criteria and/or applied after the deadline, were served for evaluation. The results of the contest shows that no technology was satisfied the criteria in the course of the contest, however, two technologies satisfied the criteria after the deadline. A review on an outline and evaluation of the applied technologies reveals current state and problems of recent audio watermarking technology. More progress in technology of audio data hiding is expected by the succeeding contests based on unified criteria for data hiding.
  • 位相変調に基づく音楽電子透かしにおける評価実験  [Not invited]
    上阪 昌毅; 荻原 昭夫; 林 繁利; 村田
    平成24年度(第63回)電気・情報関連学会中国支部連合大会  2012/10  平成24年度(第63回)電気・情報関連学会中国支部連合大会
  • 乗法的パッチワーク法に基づくブラインド型音楽電子透かしにおける耐性実験  [Not invited]
    山本 優; 荻原 昭夫; 村田 晴美
    平成24年度(第63回)電気・情報関連学会中国支部連合大会  2012/10  平成24年度(第63回)電気・情報関連学会中国支部連合大会
  • ブラインド音源分離を利用した音楽電子透かし  [Not invited]
    荻原 昭夫; 林 繁利
    平成24年度(第63回)電気・情報関連学会中国支部連合大会  2012/10  平成24年度(第63回)電気・情報関連学会中国支部連合大会
  • 音響電子透かし技術の評価基準と評価コンテスト  [Not invited]
    西村 明; 荻原 昭夫; 鵜木 祐史; 近藤 和弘; 薗田 光太郎; 岩村 惠市; 立花 隆輝
    2012/03
  • 音響信号に対する情報ハイディングの評価基準  [Not invited]
    西村 明; 荻原 昭夫; 鵜木 祐史; 近藤 和弘; 薗田 光太郎; 岩村 惠市; 立花 隆輝
    2012/03 
    論文番号3-1-24
  • 音源同定に基づく音楽電子透かし法における攻撃耐性評価  [Not invited]
    村田 晴美; 荻原 昭夫; 岩田 基 汐崎
    2012/03
  • 音響信号に対する情報ハイディング技術の評価基準  [Not invited]
    西村 明; 荻原 昭夫; 鵜木 祐史; 近藤 和弘; 薗田 光太郎; 岩村 惠市; 立花 隆輝
    2012/02 
    論文番号3F1-4
  • 表色系変換と同時に透かしを埋め込む電子透かし法  [Not invited]
    池本 貴雄; 荻原 昭夫; 岩田 基 汐崎
    2012/02 
    論文番号3F2-2
  • 印刷取り込みによる幾何歪みや色変化に対する耐性を向上させた電子透かし法  [Not invited]
    山本 和也; 荻原 昭夫; 岩田 基 汐崎
    2012/02 
    論文番号3F2-1
  • 音響信号に対する情報ハイディング及びその評価基準の検討  [Not invited]
    西村 明; 荻原 昭夫; 鵜木 祐史; 近藤 和弘; 薗田 光太郎; 岩村 惠市; 立花 隆輝
    2011/12 
    論文番号EMM2011-61
  • 複数楽器演奏曲を対象とする音源同定を用いた音楽電子透かし法  [Not invited]
    村田 晴美; 荻原 昭夫; 岩田 基 汐崎
    2011/12 
    論文番号EA2011-100
  • 時間-周波数マスキングを考慮した音楽電子透かし  [Not invited]
    林 繁利; 荻原 昭夫; 岩田 基 汐崎
    2011/10
  • 振幅の増減に基づく音楽電子透かしと振幅の分散の増減に基づく音楽電子透かしの併用  [Not invited]
    木作 かおり; 荻原 昭夫; 岸本なつみ; 岩田; 基; 汐崎 陽
    2011/10
  • 振幅の分散を用いた音楽電子透かしの埋め込みの多重化  [Not invited]
    岸本 なつみ; 荻原 昭夫; 岩田 基 汐崎
    2011/10
  • 人間の心理聴覚特性を利用した音楽電子透かしにおける音質の改善  [Not invited]
    上阪 昌毅; 荻原 昭夫; 林 繁利; 岩田; 基; 汐崎 陽
    2011/10
  • ケプストラム領域における乗法的パッチワーク法に基づいた音楽電子透かし  [Not invited]
    山本 優; 荻原 昭夫; 村田 晴美; 田; 基; 汐崎 陽
    2011/10
  • Improvement of multiplicative patchwork audio watermarking by modifying both subsets  [Not invited]
    2011 International Technical Conference on Circuits/Systems, Computers and Communications  2011
  • An audio watermarking method by using sampling sound source  [Not invited]
    2011 International Technical Conference on Circuits/Systems, Computers and Communications  2011
  • An audio watermarking method based on variance of amplitude modification  [Not invited]
    2011 International Technical Conference on Circuits/Systems, Computers and Communications  2011
  • A phase shift keying based audio watermarking method in consideration of masking curve  [Not invited]
    2011 International Technical Conference on Circuits/Systems, Computers and Communications  2011
  • 音高推定結果を考慮した単一楽器音に対する音楽電子透かし法  [Not invited]
    電子情報通信学会応用音響研究会  2010
  • 電子透かし法における適切な色変換方法の検証  [Not invited]
    2010年 電子情報通信学会ソサイエティ大会  2010
  • 透かし入り画像の画質劣化の形式や下限を規定可能な電子透かし法  [Not invited]
    2010年暗号と情報セキュリティシンポジウム  2010
  • 自動採譜結果を利用したオーディオ信号への電子透かし  [Not invited]
    2010年 電子情報通信学会総合大会  2010
  • 演奏楽器と類似した音色をもつ信号を用いた音楽電子透かし法  [Not invited]
    2010年 電子情報通信学会ソサイエティ大会  2010
  • 振幅の分散の増減に基づく音楽電子透かしにおける埋め込みの多重化  [Not invited]
    2010年 電子情報通信学会ソサイエティ大会  2010
  • 印刷画像へのフラクタル符号化に基づく電子透かし法  [Not invited]
    2010年 電子情報通信学会ソサイエティ大会  2010
  • 乗法的パッチワーク法に基づく音楽電子透かしにおける音質の向上  [Not invited]
    2010年 電子情報通信学会ソサイエティ大会  2010
  • Digital watermarking method for tamper detection and recovery of JPEG images  [Not invited]
    2010 International Symposium on Information Theory and its Applications (ISITA2010)  2010
  • An audio watermarking method by using automatic music transcription information  [Not invited]
    2010 International Symposium on Information Theory and its Applications (ISITA2010)  2010
  • A watermarking method for audio signals played with single musical instrument based on music transcription information  [Not invited]
    2010 International Symposium on Communications and Information Technologies (ISCIT2010)  2010
  • 音質改善のための直流成分を用いた音楽電子透かし法  [Not invited]
    電子情報通信学会応用音響研究会  2009
  • 隣接した局所領域間における色差成分の分散を利用した電子透かし法  [Not invited]
    2009年 暗号と情報セキュリティシンポジウム (SCIS2009)  2009
  • 振幅の増減に基づく音声電子透かしにおけるReed-Solomon 符号を用いた音質改善法  [Not invited]
    2009年 暗号と情報セキュリティシンポジウム (SCIS2009)  2009
  • 多チャンネル型音楽電子透かしにおける主観的音質評価の改善  [Not invited]
    2009年 電子情報通信学会ソサイエティ大会  2009
  • 多チャンネル型音楽電子透かしとWSS距離を考慮した音質改善  [Not invited]
    2009年 電子情報通信学会総合大会  2009
  • Sound quality improvement for multichannel audio watermarking  [Not invited]
    2009 International Technical Conference on Circuits/Systems, Computers and Communications  2009
  • Multi-layer audio watermarking based on amplitude modification  [Not invited]
    2009 Fifth International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP 2009)  2009
  • Digital watermarking method using variance of chrominance in the pairs of adjoining blocks  [Not invited]
    2009 International Technical Conference on Circuits/Systems, Computers and Communications  2009
  • 色差成分の分散を用いた微小な幾何学的改変に耐性のある電子透かし法  [Not invited]
    2008年 暗号と情報セキュリティシンポジウム (SCIS2008)  2008
  • 移動物体を考慮した色ヒストグラムによる動画像からのジェスチャ領域抽出  [Not invited]
    2008年 暗号と情報セキュリティシンポジウム (SCIS2008)  2008
  • 画像の自己相似性に基づく代表ベクトルを利用した電子透かし法  [Not invited]
    2008年 暗号と情報セキュリティシンポジウム (SCIS2008)  2008
  • 改ざん箇所の検出が可能な電子文書のデータ構造  [Not invited]
    FIT2008 第7回情報科学技術フォーラム  2008
  • 振幅の増減に基づく音楽電子透かしにおける埋め込みの多重化  [Not invited]
    2008年 電子情報通信学会総合大会  2008
  • 振幅の増減に基づく音楽電子透かしにおけるラウドネスレベルを考慮した音質改善法  [Not invited]
    2008年 暗号と情報セキュリティシンポジウム (SCIS2008)  2008
  • 幾何学的改変と結託攻撃に耐性をもたせた電子透かし法  [Not invited]
    FIT2008 第7回情報科学技術フォーラム  2008
  • 多チャンネル型音楽電子透かしとクリック雑音の低減法  [Not invited]
    2008年 電子情報通信学会ソサイエティ大会  2008
  • Watermarking method resistant to geometrical slight distortion using variance of color difference and wavelet transform  [Not invited]
    2008 International Technical Conference on Circuits/Systems, Computers and Communications  2008
  • Sound quality improvement by embedding position grouping for audio watermarking method using smearing transformation  [Not invited]
    2008 International Technical Conference on Circuits/Systems, Computers and Communications  2008
  • Sound quality improvement by eliminating high frequency component from signature impulse for audio watermarking method using smearing transformation  [Not invited]
    2008 International Technical Conference on Circuits/Systems, Computers and Communications  2008
  • Multiple embedding for time-domain audio watermarking based on low-frequency amplitude modification  [Not invited]
    2008 International Technical Conference on Circuits/Systems, Computers and Communications  2008
  • Multichannel audio watermarking method by multiple embedding  [Not invited]
    2008 International Symposium on Information Theory and its Applications (ISITA2008)  2008
  • JPEG 画像を対象とした改ざん箇所の復元可能な電子透かし法  [Not invited]
    FIT2008 第7回情報科学技術フォーラム  2008
  • A method of increasing watermark information capacity with five sections for audio watermarking method based on amplitude modification  [Not invited]
    2008 International Technical Conference on Circuits/Systems, Computers and Communications  2008
  • A method of capacity increase for time-domain audio watermarking based on low-frequency amplitude modification  [Not invited]
    AES (Audio Engineering Society) 125th convention  2008
  • 音楽電子透かしにおける同期符号検出の改善法  [Not invited]
    2007年 電子情報通信学会総合大会  2007
  • 秘密分散の原理を用いた動画像用電子透かし法  [Not invited]
    2007年 暗号と情報セキュリティシンポジウム (SCIS2007)  2007
  • 振幅の増減に基づく音楽電子透かしにおける音質改善  [Not invited]
    平成19年 電気学会電子・情報・システム部門大会  2007
  • 安全性を考慮した電子透かしによるJPEG画像の改ざん検出・修復法  [Not invited]
    2007年 暗号と情報セキュリティシンポジウム (SCIS2007)  2007
  • ロケーションマップの圧縮効率を高めた可逆電子透かし法  [Not invited]
    コンピューターセキュリティシンポジウム2007  2007
  • スミア変換による音声電子透かしの透かし信号の最適化による音質改善  [Not invited]
    平成19年 電気学会電子・情報・システム部門大会  2007
  • Sound quality improvement of audio watermarking method using smearing transformation  [Not invited]
    2007 International Technical Conference on Circuits/Systems, Computers and Communications  2007
  • Reduction of synchronization code length for audio watermarking method based on amplitude modification  [Not invited]
    2007 International Technical Conference on Circuits/Systems, Computers and Communications  2007
  • Hand gesture region extraction using skin-color histogram  [Not invited]
    2007 International Technical Conference on Circuits/Systems, Computers and Communications  2007
  • A music watermark in consideration of global gain and scalefactor in MP3 compression  [Not invited]
    2007 International Technical Conference on Circuits/Systems, Computers and Communications  2007
  • 幾何学的改変によって移動した埋め込み領域を重心を利用して同定する電子透かし法  [Not invited]
    2006年暗号と情報セキュリティシンポジウム  2006
  • ヒステリシス署名を利用したデジタル画像の長期保証に関する一考察  [Not invited]
    第5回情報科学技術フォーラム  2006
  • Video watermark for detecting alteration on spatial domain and temporal domain  [Not invited]
    2006 International Symposium on Information Theory and its Applications  2006
  • Video watermark for detecting alteration on spatial domain  [Not invited]
    2006 International Technical Conference on Circuits/Systems, Computers and Communications  2006
  • User verification method by biometric feature in keystroke motion and key press timing  [Not invited]
    2006 International Symposium on Information Theory and its Applications  2006
  • JPEG圧縮に耐性のあるデジタル画像の改ざん検出・修復可能な電子透かし  [Not invited]
    第5回情報科学技術フォーラム  2006
  • Hand region extraction by background subtraction with renewable background for hand gesture recognition  [Not invited]
    2006 IEEE International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS 2006)  2006
  • Biometric verification using keystroke motion and key press timing for ATM user authentication  [Not invited]
    2006 IEEE International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS 2006)  2006
  • Application of background subtraction with renewable background to gesture region extraction  [Not invited]
    2006 International Symposium on Information Theory and its Applications  2006
  • ATM user verification by biometric feature in keystroke motion  [Not invited]
    2006 International Technical Conference on Circuits/Systems, Computers and Communications  2006
  • A study of music watermark suitable for mp3 compression  [Not invited]
    2006 International Technical Conference on Circuits/Systems, Computers and Communications  2006
  • A music watermark in consideration of MP3 compression  [Not invited]
    2006 International Symposium on Information Theory and its Applications  2006
  • A background subtraction algorithm with renewable background  [Not invited]
    2006 International Technical Conference on Circuits/Systems, Computers and Communications  2006
  • 音声付き動画像用相関型電子透かし  [Not invited]
    電子情報通信学会2005年総合大会  2005
  • 音声付き動画を対象とした改ざん検出手法  [Not invited]
    第4回情報科学技術フォーラム  2005
  • 独立成分分析を利用した多値ロゴマーク用の電子透かし  [Not invited]
    2005年暗号と情報セキュリティシンポジウム  2005
  • 時間軸方向の周波数成分を用いた動画像用電子透かし  [Not invited]
    2005年暗号と情報セキュリティシンポジウム  2005
  • 手形状の抽出と面積時系列を用いた本人認証  [Not invited]
    2005年暗号と情報セキュリティシンポジウム  2005
  • フレーム間の類似性を利用した動画像用相関型電子透かしの時系列攻撃への対処法  [Not invited]
    2005年暗号と情報セキュリティシンポジウム  2005
  • カメラ付き携帯電話機で撮影した画像から透かしを抽出できる電子透かし法  [Not invited]
    映像情報メディア学会2005年冬季大会  2005
  • User verification in ATM operation by square measure sequence of hand shape  [Not invited]
    2005 International Technical Conference on Circuits/Systems, Computers and Communications  2005
  • DTCブロック毎の複雑さを考慮したJPEG圧縮画像に対するステガノグラフィ  [Not invited]
    2005年暗号と情報セキュリティシンポジウム  2005
  • A stock trading method utilizing the trading signal selected by GA  [Not invited]
    2005 International Technical Conference on Circuits/Systems, Computers and Communications  2005
  • A method of embedding watermark into movie with sound data  [Not invited]
    2005 International Technical Conference on Circuits/Systems, Computers and Communications  2005
  • A method of embedding watermark into audio data in consideration of MP3 compression  [Not invited]
    2005 International Technical Conference on Circuits/Systems, Computers and Communications  2005
  • 手形状の面積時系列を用いた本人認証  [Not invited]
    第3回情報科学技術フォーラム講演論文集  2004
  • ピッチ周波数に着目した合成音声詐称への対処法  [Not invited]
    2004年暗号と情報セキュリティシンポジウム予稿集  2004
  • ピッチの時間変化パターンを用いた合成音声判別法  [Not invited]
    第3回情報科学技術フォーラム  2004
  • Selection of trading signal in stock chart for stock market  [Not invited]
    2004 International Technical Conference on Circuits/Systems, Computers and Communications  2004
  • Discrimination method of synthetic speech using pitch pattern  [Not invited]
    2004 International Technical Conference on Circuits/Systems, Computers and Communication  2004
  • DP法を用いた株式銘柄選別法  [Not invited]
    電子情報通信学会2004年総合大会講演論文集  2004
  • Clustering by cross-correlation function and dynamic programming, and its application to arbitrage in stock market  [Not invited]
    2004 International Technical Conference on Circuits/Systems, Computers and Communications  2004
  • Biometric verification method using square measure sequence of hand shape  [Not invited]
    2004 International Technical Conference on Circuits/Systems, Computers and Communications  2004
  • 話者照合に対する合成音声詐称を防止するための合成音声検出法  [Not invited]
    情報処理学会コンピュータセキュリティシンポジウム2003  2003
  • 音声合成による詐称に対する話者照合システム  [Not invited]
    平成14年電気関係学会関西支部連合大会  2002
  • 顔画像を用いた個人認証システムにおける顔の静的特徴を用いた判定手法  [Not invited]
    平成13年電気関係学会関西支部連合大会  2001
  • 周期性に着目した株式売買手法  [Not invited]
    平成13年電気関係学会関西支部連合大会  2001
  • 音声対話システムにおける感性情報処理  [Not invited]
    1999年電子情報通信学会情報・システムソサイエティ大会  1999
  • Speech recognition method by fusion of auditory and visual information using Dempster-Shafer's theorem  [Not invited]
    1999 International Technical Conference on Circuits/Systems, Computers and Communications  1999
  • Dempster-Shafer確率理論を用いた視聴覚融合音声認識  [Not invited]
    1999年電子情報通信学会総合大会  1999
  • 視聴覚融合音声認識に適した唇形状抽出  [Not invited]
    電子情報通信学会技術研究報告  1998
  • 母音連鎖を利用した放送ニュースの話題セグメンテーション  [Not invited]
    1998年電子情報通信学会情報・システムソサイエティ大会  1998
  • 母音連鎖の類似性に着目した放送ニュースの話題セグメンテーション  [Not invited]
    平成10年電気関係学会関西支部連合大会  1998
  • 唇形状抽出における雑音除去処理  [Not invited]
    平成10年電気関係学会関西支部連合大会  1998
  • 共起ヒストグラムを用いた視聴覚融合音声認識  [Not invited]
    1998年電子情報通信学会情報・システムソサイエティ大会  1998
  • 共起ヒストグラムと一次結合を併用した視聴覚融合音声認識  [Not invited]
    平成10年電気関係学会関西支部連合大会  1998
  • ピッチ情報を考慮した音声対話システム  [Not invited]
    1998年電子情報通信学会総合大会  1998
  • ピッチ情報を用いた肯定・疑問の判定に関する検討  [Not invited]
    平成10年電気関係学会関西支部連合大会  1998
  • カラー情報を用いた唇形状の抽出  [Not invited]
    1998年電子情報通信学会総合大会  1998
  • 量子化コードと音素ラベルとの統計的対応に基づく音声処理手法  [Not invited]
    第12回ディジタル信号処理シンポジウム  1997
  • 自由発話音声中の冗長語に対処した音声処理手法  [Not invited]
    電子情報通信学会技術研究報告  1997
  • 時間遅れニューラルネットワークを用いた視聴覚融合音声認識  [Not invited]
    1997年電子情報通信学会総合大会  1997
  • ガーベジHMMを用いた音声スイッチ  [Not invited]
    1997年電子情報通信学会総合大会  1997
  • TDNNによる視聴覚融合音声認識手法の検討  [Not invited]
    第12回ディジタル信号処理シンポジウム  1997
  • 計算機情報を用いた自由発話音声認識システム ~音声によるオペレーション~  [Not invited]
    第11回ディジタル信号処理シンポジウム  1996
  • フルフレーム・フルカラー画像を用いた視聴覚融合音声認識  [Not invited]
    第11回ディジタル信号処理シンポジウム  1996
  • フルフレーム・カラー画像を用いた視聴覚融合音声認識  [Not invited]
    1996年電子情報通信学会総合大会  1996
  • カラー情報を用いた顔全体画像からの唇輪郭の抽出 -視聴覚融合による音声認識-  [Not invited]
    1996年電子情報通信学会総合大会  1996
  • 音声信号と動画像信号の視聴覚融合による音声認識手法  [Not invited]
    電子情報通信学会第8回回路とシステム軽井沢ワークショップ  1995
  • 視聴覚融合による音声認識に適した口形特徴量の検討  [Not invited]
    1995年電子情報通信学会総合大会  1995
  • 自由発話音声中の無音区間に着目した冗長語除去手法  [Not invited]
    1995年電子情報通信学会総合大会  1995
  • カオスニューラルネットワークの最小値探索能力  [Not invited]
    電子情報通信学会技術研究報告  1995
  • カオスニューラルネットワークの最小値探索原理に関する線形代数的解析  [Not invited]
    電子情報通信学会第8回回路とシステム軽井沢ワークショップ  1995
  • カオスニューラルネットの最小値探索原理についての考察  [Not invited]
    1995年電子情報通信学会総合大会  1995
  • カオスニューラルネットのダイナミクスと最小値探索  [Not invited]
    電気学会研究会資料(情報処理研究会)  1995
  • Speech recognition method using fusion of auditory and visual information  [Not invited]
    1995 Joint Technical Conference on Circuits/Systems, Computers and Communications  1995
  • An eliminating method of filled pauses with silent part included in spontaneous speech  [Not invited]
    1995 Joint Technical Conference on Circuits/Systems, Computers and Communications  1995
  • A study on the mechanism of the minimum searching by the chaotic neural network  [Not invited]
    IEEE International Conference on Neural Networks  1995
  • A study of an attractor of chaotic neural networks and objective function of minimum searching problem  [Not invited]
    1995 Joint Technical Conference on Circuits/Systems, Computers and Communications  1995
  • 非対称結合を有するネットワークを用いたナップザック問題の解法  [Not invited]
    電子情報通信学会第7回回路とシステム軽井沢ワークショップ  1994
  • 負の自己結合を有する離散値型ニューラルネットワークとその応用  [Not invited]
    電子情報通信学会技術研究報告  1994
  • 視聴覚融合によるHMM音声認識  [Not invited]
    1994年電子情報通信学会春季大会  1994
  • 一次結合を用いた視聴覚融合によるHMM音声認識手法  [Not invited]
    平成6年電気関係学会関西支部連合大会  1994
  • ヒューリスティックスを導入した連続 Viterbi アルゴリズムによるキーワードスポッティング  [Not invited]
    平成6年電気関係学会関西支部連合大会  1994
  • カオスニューラルネットワークにおける最小値探索に関する考察  [Not invited]
    平成6年電気関係学会関西支部連合大会  1994
  • Keyword spotting using continuous Viterbi algorithm with heuristics for island-driven A* search  [Not invited]
    1994 Joint Technical Conference on Circuits/Systems, Computers and Communications  1994
  • Isolated digit recognition based on HMM using simultaneous generative histogram  [Not invited]
    1994 Joint Technical Conference on Circuits/Systems, Computers and Communications  1994
  • HMM音声認識における視聴覚融合手法  [Not invited]
    電子情報通信学会技術研究報告  1994
  • 部分巡路への収束を抑制するニューロンを用いたTSPの解法  [Not invited]
    1993年電子情報通信学会秋季大会  1993
  • 自己相関型連想記憶に有効な自己結合荷重の設定法  [Not invited]
    1993年電子情報通信学会秋季大会  1993
  • 巡回セールスマン問題における目的関数の一構成法  [Not invited]
    1993年電子情報通信学会春季大会  1993
  • ニューラルネットワークによる時間的な連続性を考慮したピッチ抽出法  [Not invited]
    1993年電子情報通信学会秋季大会  1993
  • ニューラルネットのダイナミクスを考慮したTSPの目的関数の一構成法  [Not invited]
    電子情報通信学会第6回回路とシステム軽井沢ワークショップ  1993
  • シンボル共起ヒストグラムを用いたHMMによる孤立単語音声認識  [Not invited]
    1993年電子情報通信学会秋季大会  1993
  • Neural networks with negative self-feedback and its application to TSP  [Not invited]
    1993 Joint Technical Conference on Circuits/Systems, Computers and Communications  1993
  • Island-driven型のA*探索を用いた連続音声認識  [Not invited]
    1993年電子情報通信学会春季大会  1993
  • Island-driven A* search suitable for a finite stack and its application to continuous speech recognition  [Not invited]
    1993 Joint Technical Conference on Circuits/Systems, Computers and Communications  1993
  • Improvement of the pseudoinverse rule for associative neural network  [Not invited]
    1993 Joint Technical Conference on Circuits/Systems, Computers and Communications  1993
  • A method for selecting the most suitable pitch with neural network  [Not invited]
    1993 Joint Technical Conference on Circuits/Systems, Computers and Communications  1993
  • 組合せ的最適化問題の一解法:主軸移動法  [Not invited]
    電子情報通信学会第5回回路とシステム軽井沢ワークショップ  1992
  • シンボル同時生起ヒストグラムを用いたHMM訓練法  [Not invited]
    1992年電子情報通信学会春季大会  1992
  • PDNを用いた連想記憶ニューラルネットワーク  [Not invited]
    電子情報通信学会第5回回路とシステム軽井沢ワークショップ  1992
  • 波形分析による電力系統の事故原因診断システム  [Not invited]
    平成3年電気関係学会関西支部連合大会  1991
  • 文章間の主題遷移を考慮した連続音声認識モデル  [Not invited]
    1991年電子情報通信学会春季全国大会  1991
  • A switched capacitor pitch extraction circuit using the autocorrelation function and its application to spectral analysis  [Not invited]
    1991 International Conference on Circuit and Systems  1991
  • A pitch synchronous switched capacitor discrete Fourier transform circuit  [Not invited]
    IEEE International Symposium on Circuits and Systems  1991
  • プログラマブル・キャパシタアレイを用いたSCピッチ抽出回路  [Not invited]
    平成2年電気関係学会関西支部連合大会  1990
  • SCニューラルネットワークとその文字認識への応用  [Not invited]
    電子情報通信学会第3回回路とシステム軽井沢ワークショップ  1990
  • SCエネルギー算出回路とその音素セグメンテーションへの応用  [Not invited]
    1990年電子情報通信学会春季全国大会  1990
  • Fuzzy matrix quantization and its application to speaker-independent isolated word recognition  [Not invited]
    1990 Joint Technical Conference on Circuits/Systems, Computers and Communications  1990
  • 音声分析用スイッチト・キャパシタピッチ検出回路  [Not invited]
    1989年電子情報通信学会春季全国大会  1989
  • スイッチト・キャパシタ回路による実時間音声分析用ピッチ検出回路  [Not invited]
    電子情報通信学会技術研究報告  1989
  • A switched-capacitor 64 points DFT-IDFT system and its application to real time processing of vowel recognition  [Not invited]
    1989 International Conference on Circuit and Systems  1989
  • スイッチト・キャパシタを用いた64ポイントDFT回路  [Not invited]
    昭和63年電子情報通信学会春季全国大会  1988
  • スイッチト・キャパシタ離散フーリエ変換-逆変換回路の拡張・設計・支援シミュレーション  [Not invited]
    電子情報通信学会技術研究報告  1987
  • SC・DFT-IDFT回路の実現とそのPCによるシミュレーション  [Not invited]
    昭和62年電子情報通信学会創立70周年記念総合全国大会  1987

Affiliated academic society

  • 映像情報メディア学会   日本音響学会   米国電気電子学会(THE INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS,INC.)   情報処理学会   電子情報通信学会   

Research Themes

  • 文部科学省:科学研究費補助金(基盤研究(C))
    Date (from‐to) : 2014 -2016 
    Author : 荻原 昭夫
  • コクピットミラーの研究
    NSウエスト株式会社:
    Date (from‐to) : 2013/07 -2014/03
  • 脳波信号による音質評価手法の開発および食品の味評価への応用
    財団法人 サタケ技術振興財団:
    Date (from‐to) : 2013/06 -2014/03
  • Ministry of Education, Culture, Sports, Science and Technology:Grants-in-Aid for Scientific Research(基盤研究(C))
    Date (from‐to) : 2011 -2013 
    Author : Akio OGIHARA; Harumi MURATA
     
    In our multilayer type audio watermarking method, we increase the capacity of embedding by introducing multi-layered embedding process of watermark information. However, there is the problem that sound quality degradation is likely to be perceived according to multi-layered embedding process. In this research, we reduce the sound quality degradation by introducing "optimized window function" and "sound quality improvement technique using error correcting code" into the multilayer type audio watermarking method. As a consequence, we realized the balance of embedding capacity and sound quality.
  • 多重埋め込み型音楽電子透かしによるデータ容量増加手法の開発
    独立行政法人 科学技術振興機構:シーズ発掘試験A(発掘型)
    Date (from‐to) : 2009
  • 高精細デジタル写真・大画面ディスプレイ用デジタルコンテンツ創生技術に関する研究
    ビバコンピュータ(株):
    Date (from‐to) : 2005 -2008
  • Study on Natural Language Description of Human Behavior from Image Sequences and Its Application to Monitoring Systems
    Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (B)
    Date (from‐to) : 1997 -1998 
    Author : FUKUNAGA Kunio; KOJIMA Atsuhiro; AKASHI Hiroshi; OGIHARA Akio; IZUMI Masao; TAKAMATSU Shinobu
     
    In this projeact we propose a system, which generates natural language descriptions of human behavior from image sequences and speech. In general, video-monitoring systems are widely used for pelient monitoring television system in medical facilities, monitoring rare animals in a zoo and condition monitoring for security systems. It is necessary for these systems to reduce traffic under limited communication capacity when transmit the scene of monitoring objects or the condition. The proposed system sequentially estimates the 3-D position and orientation of a man appeared on a monitoring image sequence. Then, the trace or series of estimated positions is divided into concrete motion segments. For each segment, features of an action of the man appeared on the monitoring images is extracted and associated with the most suitable verb, in some case carried with the aid of speech recognition. In addition, some sequences of verbs are combined into high-level verbs. Finally the system composes sentences expressing the movements of the man using the extracted verb and the corresponding frame structure expression based on the flame structure grammar.
  • 文部科学省:科学研究費補助金(奨励研究(A))
    Date (from‐to) : 1997 -1998 
    Author : 荻原 昭夫
     
    本課題では、様々な環境下における音声による対話(マン-マシンインターフェイス)の実現を目的とし、視聴覚融合音声認識システムに関する研究を行なった。具体的には,「人間の目の役割を演ずるテレビカメラ」と「耳の役割を演ずるマイクロホン」から得られた情報を対象としてモバイルコンピュータ上で統合認識処理を行なうことにより、柔軟性のあるマン-マシンインターフェイスの実現を試みている。本研究の目的である「モバイル視聴覚融合音声認識システム」は,3つの処理(「1.視聴覚情報のデータ収集」,「2.融合および認識手法の開発」,「3.モバイルコンピュータへの実装」)から構築される。平成10年度は,「3.モバイルコンピュータへの実装」に関する研究を行なった。また同時に、昨年度までの成果に改良を加えることにより認識精度の改善を行なった。・モバイルコンピュータへの実装昨年度までの研究成果である視聴覚融合音声認識システムをモバイル型マルチメディアコンピュータ上に実装し、室外などの様々な騒音環境下を想定して音声認識実験を行なった。その結果、各種実験により高騒音環境における認識率改善の点で、提案手法が有効であることを確認できた。・融合手法の改善昨年度までの研究成果である視聴覚融合音声認識システムにおける視聴覚融合手法に改善を加えた。具体的には、HMMの出力確率の計算を行なう際にDempster-Shafer確率理論を導入することで、背景騒音などの認識環境により適合した融合を行なうことが可能となり、結果として認識精度の向上を実現した。なお,上述の実験に用いたモバイル型マルチメディアコンピュータは、本科学研究費補助金研究により購入した設備備品である。
  • 電子透かし技術に関する研究
    セコム科学技術振興財団研究助成:
    Date (from‐to) : 1998
  • 離散HMMによる連続音声認識に関する研究
    大阪ガス(株):
    Date (from‐to) : 1997
  • 文部科学省:科学研究費補助金(奨励研究(A))
    Date (from‐to) : 1996 -1996 
    Author : 荻原 昭夫
     
    本課題では,動画像を使用した視聴覚融合による人間と計算機との対話システムの実現を目的とし,視聴覚融合音声認識システムに関する研究を行なった.特に,近年,急速に普及しつつあるマルチメディアコンピュータ(「動画像の表示」や「音響信号の録音・再生」などの機能を有するコンピュータ)上に視聴覚融合音声認識手法を実装することで,特殊な装置を一切用いることなく音声認識システムを実現することを試みた.本研究で構築を行なった「マルチメディアコンピュータによる視聴覚融合音声認識システム」では,マルチメディアコンピュータが有している“音声同期型動画像入力機能"を用いてフルフレーム(30fps, 1秒間当たり30フレーム)・フルカラー(24 bit color)の動画像をディジタル形式のデータとして撮影する.その後,この動画像を対象として,特徴抽出処理,視聴覚融合処理,音声認識処理の各処理をマルチメディアコンピュータ上で行なう.なお,視聴覚融合処理については,「1次結合によるHMM(隠れマルコフモデル)視聴覚融合手法」と「TDNN(時間遅れニューラルネットワーク)による視聴覚融合手法」の2種類の手法により実現している.本システム用いて音声認識実験を行なった結果,・唇の動きが速いために認識が困難であった子音に対する効果・マルチメディアコンピュータ上への視聴覚融合音声認識システムの実装可能性を確認した.さらに,認識率を改善する方策として,口唇形状をより反映する視覚特徴量の抽出法について検討を進めている.なお,上述のシステムの構築,および,実験評価の実施に際して,本科学研究費補助金研究により購入した設備備品を使用した.
  • 文部科学省:科学研究費補助金(奨励研究(A))
    Date (from‐to) : 1995 -1995 
    Author : 荻原 昭夫
     
    本課題では,動画像を使用した視聴覚融合による人間と計算機との対話システムの実現への第一段階として,比較的発話時間の短い文章(人間から計算機への一方通行)を対象とした視聴覚融合による音声認識システムを実現する事を目的とし,動画像を用いた視聴覚融合音声認識システムに関する研究を行なった.本研究で構築を行なった「フルフレーム画像を対象とした視聴覚融合音声認識システム」では,視聴覚情報の入力手段として “音声同期型動画像入力機能を有しているマルチメディアパソコン" を用いて,フルフレーム(30fps,1秒間当たり30フレーム)の動画像をディジタル形式のデータとして撮影する.その後,この動画像を対象として,HMM(隠れマルコフモデル)に多次元ベクトル量子化を組み合わせた認識モデル上で,特徴抽出処理,視聴覚融合処理,音声認識処理の各処理を行なう.なお,本システムでは,「視覚情報用(動画像用)HMMにより算出された対数尤度」と「聴覚情報用(音声用)HMMにより算出された対数尤度」とを1次結合するというシンプルかつ効果的な手法により視聴覚融合処理を実現している.本システム用いて音声認識実験を行なった結果,・母音発声時の音声認識精度の向上・唇の動きが速いために動画像による認識が困難であった子音に対する効果を確認した.さらに,ニューラルネットワークを利用した視聴覚融合処理方式についても検討を進めており,今後は音声認識システムへの実装を試みる予定である.なお,上述のシステムの構築,および,実験評価の実施に際して,本科学研究費補助金研究により購入した設備備品を使用した.
  • マルチメディアパーソナルコンピュータによる視聴覚情報を利用した音声認識に関する研究
    実吉奨学会研究助成:
    Date (from‐to) : 1994
  • 送電線の故障診断に関する研究
    (株)近計システム:
    Date (from‐to) : 1990 -1992

Media Coverage

  • デジタル音楽保護「電子透かし」不正防ぐ
    Date : 2021/08/29
    Writer: Other than myself
    Publisher, broadcasting station: 中国新聞社
    Program, newspaper magazine: 中国新聞(朝刊)
    18面 Paper
  • 生体認証セキュリティシステムの解説
    Date : 2008/10/21
    Publisher, broadcasting station: 朝日放送(TV)
    Program, newspaper magazine: ムーブ
    Media report
  • 先端技術 電子透かし技術 進む開発
    Date : 2005/03/30
    Publisher, broadcasting station: 日本経済新聞社
    Program, newspaper magazine: 日経産業新聞
    Paper