波部 斉 (ハベ ヒトシ)

  • 情報学部 情報学科 教授
Last Updated :2024/04/25

コミュニケーション情報 byコメンテータガイド

  • コメント

    画像・映像に写っているモノ・コトをコンピュータで理解する技術の研究を行っています。特に、行き交う人の行動や、魚などの生物の行動を獲得・解析する技術に着目して研究しています。
  • 報道関連出演・掲載一覧

    <報道関連出演・掲載一覧> ●2020/2/10  産経新聞  顔認証技術の活用と問題点について

研究者情報

学位

  • 博士(情報学)(2006年11月 京都大学)

ホームページURL

科研費研究者番号

  • 80346072

ORCID ID

Researcher ID

  • K-1724-2015

J-Global ID

プロフィール

  • 1997年京都大学工学部電気工学第二学科卒業,1999年同大学大学院工学研究科電子通信工学専攻修士課程修了.三菱電機(株),京都大学助手,奈良先端科学技術大学院大学助手・助教,大阪大学産業科学研究所特任講師(常勤)を経て2012年より近畿大学理工学部情報学科講師,2018年より同准教授,2022年より近畿大学情報学部情報学科准教授.2024年より近畿大学情報学部情報学科教授.近畿大学情報学研究所を兼務.京都大学博士(情報学).コンピュータビジョンに関する研究に従事.情報処理学会シニア会員,電子情報通信学会シニア会員,IEEE,ACM,電気学会,人工知能学会,日本水産学会会員

研究キーワード

  • 画像認識   視覚情報処理   3次元映像メディア   画像理解   コンピュータビジョン   

現在の研究分野(キーワード)

    画像・映像に写っているモノ・コトをコンピュータで理解する技術の研究を行っています。特に、行き交う人の行動や、魚などの生物の行動を獲得・解析する技術に着目して研究しています。

研究分野

  • 情報通信 / 情報ネットワーク
  • 情報通信 / 計算機システム
  • 情報通信 / 知能情報学
  • 情報通信 / 知能ロボティクス
  • 情報通信 / 知覚情報処理

経歴

  • 2024年04月 - 現在  近畿大学総合理工学研究科 エレクトロニクス系工学専攻教授
  • 2024年04月 - 現在  近畿大学情報学研究所教授
  • 2024年04月 - 現在  近畿大学情報学部 情報学科教授
  • 2018年04月 - 2024年04月  近畿大学総合理工学研究科 エレクトロニクス系工学専攻准教授
  • 2022年04月 - 2024年03月  近畿大学情報学部 情報学科准教授
  • 2021年01月 - 2024年03月  近畿大学情報学研究所准教授
  • 2018年04月 - 2022年03月  近畿大学理工学部情報学科准教授
  • 2015年04月 - 2021年04月  近畿大学大学院総合理工学研究科
  • 2012年04月 - 2018年03月  近畿大学理工学部 情報学科講師
  • 2011年12月 - 2012年03月  大阪大学産業科学研究所特任講師(常勤)
  • 2007年04月 - 2011年11月  奈良先端科学技術大学院大学情報科学研究科助教
  • 2010年03月 - 2011年02月  ケンブリッジ大学工学部Visiting Scholar
  • 2006年12月 - 2007年03月  奈良先端科学技術大学院大学 情報科学研究科助手
  • 2003年04月 - 2006年11月  京都大学大学院工学研究科助手
  • 2002年07月 - 2003年03月  京都大学学術情報メディアセンター助手
  • 1999年04月 - 2002年07月  三菱電機株式会社(電力・産業システム事業所)

学歴

  • 1997年04月 - 1999年03月   京都大学   工学研究科   電子通信工学専攻
  • 1993年04月 - 1997年03月   京都大学   工学部   電気工学第二学科

所属学協会

  • 電気学会   日本水産学会   人工知能学会   ACM   IEEE   電子情報通信学会   情報処理学会   

研究活動情報

論文

  • Ikuto Ogawa; Masayuki Otani; Koji Abe; Nobukazu Iguchi; Hitoshi Habe
    2022 IEEE 8th World Forum on Internet of Things (WF-IoT) 2022年10月
  • Mika Yamamuro; Yoshiyuki Asai; Naomi Hashimoto; Nao Yasuda; Hiroto Kimura; Takahiro Yamada; Mitsutaka Nemoto; Yuichi Kimura; Hisashi Handa; Hisashi Yoshida; Koji Abe; Masahiro Tada; Hitoshi Habe; Takashi Nagaoka; Seiun Nin; Kazunari Ishii; Yongbum Lee
    16th International Workshop on Breast Imaging (IWBI2022) 2022年07月
  • Mika Yamamuro; Yoshiyuki Asai; Naomi Hashimoto; Nao Yasuda; Hiroto Kimura; Takahiro Yamada; Mitsutaka Nemoto; Yuichi Kimura; Hisashi Handa; Hisashi Yoshida; Koji Abe; Masahiro Tada; Hitoshi Habe; Takashi Nagaoka; Seiun Nin; Kazunari Ishii; Yohan Kondo
    Biomedical physics & engineering express 8 4 2022年06月 
    This study investigates the equivalence or compatibility between U-Net and visual segmentations of fibroglandular tissue regions by mammography experts for calculating the breast density and mean glandular dose (MGD). A total of 703 mediolateral oblique-view mammograms were used for segmentation. Two region types were set as the ground truth (determined visually): (1) one type included only the region where fibroglandular tissue was identifiable (called the 'dense region'); (2) the other type included the region where the fibroglandular tissue may have existed in the past, provided that apparent adipose-only parts, such as the retromammary space, are excluded (the 'diffuse region'). U-Net was trained to segment the fibroglandular tissue region with an adaptive moment estimation optimiser, five-fold cross-validated with 400 training and 100 validation mammograms, and tested with 203 mammograms. The breast density and MGD were calculated using the van Engeland and Dance formulas, respectively, and compared between U-Net and the ground truth with the Dice similarity coefficient and Bland-Altman analysis. Dice similarity coefficients between U-Net and the ground truth were 0.895 and 0.939 for the dense and diffuse regions, respectively. In the Bland-Altman analysis, no proportional or fixed errors were discovered in either the dense or diffuse region for breast density, whereas a slight proportional error was discovered in both regions for the MGD (the slopes of the regression lines were -0.0299 and -0.0443 for the dense and diffuse regions, respectively). Consequently, the U-Net and ground truth were deemed equivalent (interchangeable) for breast density and compatible (interchangeable following four simple arithmetic operations) for MGD. U-Net-based segmentation of the fibroglandular tissue region was satisfactory for both regions, providing reliable segmentation for breast density and MGD calculations. U-Net will be useful in developing a reliable individualised screening-mammography programme, instead of relying on the visual judgement of mammography experts.
  • Takashi Nagaoka; Takenori Kozuka; Takahiro Yamada; Hitoshi Habe; Mitsutaka Nemoto; Masahiro Tada; Koji Abe; Hisashi Handa; Hisashi Yoshida; Kazunari Ishii; Yuichi Kimura
    Advanced Biomedical Engineering 11 76 - 86 2022年 [査読有り]
  • Emyo Fujioka; Mika Fukushiro; Kazusa Ushio; Kyosuke Kohyama; Hitoshi Habe; Shizuko Hiryu
    Journal of Robotics and Mechatronics 33 3 556 - 563 2021年06月 [査読有り]
     
    Echolocating bats perceive the surrounding environment by processing echoes of their ultrasound emissions. Echolocation enables bats to avoid colliding with external objects in complete darkness. In this study, we sought to develop a method for measuring the collective behavior of echolocating bats (Miniopterus fuliginosus) emerging from their roost cave using high-sensitivity stereo-camera recording. First, we developed an experimental system to reconstruct the three-dimensional (3D) flight trajectories of bats emerging from the roost for nightly foraging. Next, we developed a method to automatically track the 3D flight paths of individual bats so that quantitative estimation of the population in proportion to the behavioral classification could be conducted. Because the classification of behavior and the estimation of population size are ecologically important indices, the method established in this study will enable quantitative investigation of how individual bats efficiently leave the roost while avoiding colliding with each other during group movement and how the group behavior of bats changes according to weather and environmental conditions. Such high-precision detection and tracking will contribute to the elucidation of the algorithm of group behavior control in creatures that move in groups together in three dimensions, such as birds.
  • Hitoshi Habe; Yoshiki Takeuchi; Kei Terayama; Masa-aki Sakagami
    Journal of Robotics and Mechatronics 33 3 547 - 555 2021年06月 [査読有り]
     
    We propose a pose estimation method using a National Advisory Committee for Aeronautics (NACA) airfoil model for fish schools. This method allows one to understand the state in which fish are swimming based on their posture and dynamic variations. Moreover, their collective behavior can be understood based on their posture changes. Therefore, fish pose is a crucial indicator for collective behavior analysis. We use the NACA model to represent the fish posture; this enables more accurate tracking and movement prediction owing to the capability of the model in describing posture dynamics. To fit the model to video data, we first adopt the DeepLabCut toolbox to detect body parts (i.e., head, center, and tail fin) in an image sequence. Subsequently, we apply a particle filter to fit a set of parameters from the NACA model. The results from DeepLabCut, i.e., three points on a fish body, are used to adjust the components of the state vector. This enables more reliable estimation results to be obtained when the speed and direction of the fish change abruptly. Experimental results using both simulation data and real video data demonstrate that the proposed method provides good results, including when rapid changes occur in the swimming direction.
  • S. Abe; T. Takagi; S. Torisawa; K. Abe; H. Habe; N. Iguchi; K. Takehara; S. Masuma; H. Yagi; T. Yamaguchi; S. Asaumi
    Aquacultural Engineering 93 102146 - 102146 2021年01月 [査読有り]
  • Abe, K.; Kuroda, S.; Habe, H.
    Sensors and Materials 32 11 3581 - 3594 2020年11月 [査読有り]
  • Abe, K.; Miyake, K.; Habe, H.
    Sensors and Materials 32 11 3595 - 3606 2020年11月 [査読有り]
  • Koji Abe; Masaru Tanaka; Hitoshi Habe; Yoshiaki Taniguchi; Nobukazu Iguchi
    Proceedigns of ICFSP 2018 105 - 109 2018年09月 [査読有り]
  • Hirotake Yamazoe; Hitoshi Habe; Ikuhisa Mitsugami; Yasushi Yagi
    Computational Visual Media 4 2 1 - 9 Springer 2018年03月 [査読有り]
  • 波部斉; 橋本知典; 満上育久; 鷲見和彦; 八木康史
    日本知能情報ファジイ学会誌 29 3 605 - 610 2017年06月 [査読有り]
     
    環境に設置されたセンサで獲得した情報から,公共空間や商業施設などを行き交う人々が構成するグループを検出できれば, そのグループに応じた情報提供が可能となり,さらには施設の利用状況を知る貴重な情報となる.グループの存在を知るにはお互いの距離や視線方向などが有用であるが,混雑していたり,グループが分かれて行動しているときなどでは十分ではない.我々はこのような場合に有用な特徴として,人物間のインタラクションを示すジェスチャーに着目した歩行者グループ検出手法を提案する.提案手法では,防犯カメラで捉えた画像のオプティカルフローの変化でジェスチャーを検知し,人物間距離や視線方向にこの検知結果を加味してグループを検出する.実環境で収集したデータを用いた評価実験を行い,ジェスチャー情報を利用するとグループの見落としが低減できることを確認した.
  • Yasushi Yagi; Ikuhisa Mitsugami; Satoshi Shioiri; Hitoshi Habe
    Human-Harmonized Information Technology 2 139 - 172 2017年04月 [査読有り]
     
    Gait is known as one of biometrics, and there have been many studies on gait authentication. In those studies, it is implicitly assumed that the gait of a certain person is always constant. It is, however, untrue in reality a person usually walks differently according to their mood and physical/mental conditions, which we call "inertial states."Motivated by this fact, we organized the research project "Behavior Understanding based on Intention-Gait Model", whichwas supported by JST-CREST from 2010 to 2017. The goal of this project was to map "gait", in the broad sense of the term, to inertial states such as attention, social factors, and cognitive ability. In this chapter, we provide an overview of the three kinds of estimation technologies considered in this project: attention, social factors, and cognitive ability.
  • Kaho Yamada; Takeshi Yoshida; Kazuhiko Sumi; Hitoshi Habe; Ikuhisa Mitsugami
    THIRTEENTH INTERNATIONAL CONFERENCE ON QUALITY CONTROL BY ARTIFICIAL VISION 2017 10338 2017年 [査読有り]
     
    Recently, dense trajectories [1] have been shown to be a successful video representation for action recognition, and have demonstrated state-of-the-art results with a variety of datasets. However, if we apply these trajectories to gesture recognition, recognizing similar and fine-grained motions is problematic. In this paper, we propose a new method in which dense trajectories are calculated in segmented regions around detected human body parts. Spatial segmentation is achieved by body part detection [2]. Temporal segmentation is performed for a fixed number of video frames. The proposed method removes background video noise and can recognize similar and fine-grained motions. Only a few video datasets are available for gesture classification; therefore, we have constructed a new gesture dataset and evaluated the proposed method using this dataset. The experimental results show that the proposed method outperforms the original dense trajectories.
  • 佐藤僚太; 波部斉; 満上育久; 佐竹聡; 鷲見和彦; 八木康史
    日本知能情報ファジイ学会誌 28 6 920 - 931 日本知能情報ファジィ学会 2016年12月 [査読有り]
     
    公共空間内を往来する歩行者の属性や行動目的などを推定する技術は,施設の利用状況を自動的に観測し,各人物に最適な情報提供を行う情報環境の構築に貢献できる.その際には,どの人物同士が共に行動しているのかを推定し,歩行者をグループとして扱う技術が求められる.歩行者のグループを検出するには,2人の歩行者間の歩行軌跡や注意の向きの関係を手がかりとする手法が多く用いられる.これらの手法は,観測データ全体から特徴量を抽出して識別しており,歩行者グループは常にグループらしい動きをすること前提としている.しかし,実空間での歩行者グループは各個人の興味の対象の違いや障害物を回避する道筋の違いなどから常にグループらしい行動をする訳ではない.これによって,これまでの手法ではグループ検出が困難となる事例が見られる.本研究では,歩行データの時系列分割とマルチプル・インスタンス・ラーニング(MIL)によって,行動中の短時間に存在するグループらしい振る舞いを検出する手法を提案する.提案手法では,歩行データを時系列分割し,各時間区間の特徴量をMILを用いて別々に識別する.MILは教師あり学習の一種であり,複数の要素データの集合であるバッグ内に,少なくとも1つの正の要素データがあるかどうかを識別する.上記の時系列分割によって,時間区間の一部にグループらしい特徴があればそれを検出することができる.実験では,グループ動作を模擬したデータと,実際のショッピングモールで取得したデータを利用し,提案手法の有効性を確認した.
  • Koji Abe; Ryota Shimizu; Hitoshi Habe; Yoshiaki Taniguchi; Nobukazu Iguchi
    ACM International Conference Proceeding Series 6 - 10 2016年11月 [査読有り]
     
    As a method for supporting fish farming, this paper presents a video scene detection when farmed fry start instantaneously in a tank due to environmental stimuli. Although some environmental stimuli such as sound noises or lighting startle the fry and the stimuli bring about the instantaneous response, actual situations around the tanks in which the stimuli occur are unclear in detail. From the fact the fry often die due to crashes to the tank's wall and between the fry by the response, a monitoring system for the fry and situation around the pool could find causes of the stimuli, and it could result in decrease of the death number of the fry. In this research, the fry which swim in a tank are monitored by a video cam- era and the video scenes at the response are detected by a SVM with a feature value which represents fry's acceleration using sequential frames of the moving image. Preparing the moving images which include scenes of the response by fish in a tank, performances of the proposed method were examined. From experimental results, accuracy ratios of the recall and the precision for the scene detection have shown more than 80% on average and 100% under normal illuminances (108.5 lux on average), respectively.
  • Terayama, K.; Habe, H.; Sakagami, M.-A.
    IPSJ Transactions on Computer Vision and Applications 8 1 2016年08月 [査読有り]
     
    We propose a visual tracking method with an NACA airfoil model for dense fish schools in which occlusions occur frequently. Although much progress has been made for tracking multiple objects, it remains a challenging task to track individuals due to factors such as occlusion and target appearance variation. In this paper, we first introduce a NACA airfoil model as a deformable appearance model of fish. For occluded fish, we estimate their positions, angles, and postures with template matching and simulated annealing algorithms to effectively optimize their parameters. To improve performance of tracking, we repeatedly track fish with the parameter estimation algorithm forwards and backwards. We prepared two real fish scenes in which the average number of fish is over 25 in each frame and multiple fish superimpose over 50 times. Experimental results for the scenes show that fish are practically tracked with our method compared to a tracking method based on a mixture particle filter. Over 75 % of fish in each scene have been tracked throughout the scene, and the average difference is less than 4 % of the mean body length of the school.
  • Hiroyuki Masaki; Hitoshi Habe; Nobukazu Iguchi
    PROCEEDINGS OF 2016 10TH INTERNATIONAL CONFERENCE ON COMPLEX, INTELLIGENT, AND SOFTWARE INTENSIVE SYSTEMS (CISIS) 569 - 571 2016年 [査読有り]
     
    We have developed a screen sharing system to share contents between two persons, and applicable to one-to-one remote teaching. The screen of a PC at one side is shared with the screen of a tablet at the other side through the network to convey instructions from an operator to a collaborator. This system makes it possible to arbitrarily select a part of the screen of the PC at the operator side. The selected screen is presented in the tablet at the collaborator side. The collaborator can adjust the scale of contents, and capture the screen. By analyzing such operations, the system can understand and record which parts of the contents the collaborator paid attention to. In addition, the camera of the tablet can be used as a simple scanner to digitize paper documents easily. Further, characters and symbols drawn with a finger or a pen on the tablet screen can be presented on the PC at the other side.
  • Mitsuru Nakazawa; Ikuhisa Mitsugami; Hitoshi Habe; Hirotake Yamazoe; Yasushi Yagi
    IEEJ TRANSACTIONS ON ELECTRICAL AND ELECTRONIC ENGINEERING 10 S108 - S115 2015年10月 [査読有り]
     
    When using multiple Kinects, there must be enough distances among neighboring Kinects to avoid spoiled range data caused by the interference of their infrared speckle patterns. In the arrangement, their overlapped regions are too small to apply existing calibration methods using correspondences between their observations straightforwardly. Therefore, we propose a method to calibrate Kinects without large overlapped regions. In our method, first, we add extra RGB cameras in an environment to compensate overlapped regions. Thanks to them, we can estimate their camera parameters by obtaining correspondences between color images. Next, for accurate calibration, which considers range data as well as color images of Kinects, we optimize the estimated parameters by minimizing both the errors of correspondences between color images and those of range data of planar regions, which exist in a general environment such as walls and floors. Although our method consists of conventional techniques, its combination is optimized to achieve the calibration. (C) 2015 Institute of Electrical Engineers of Japan. Published by John Wiley & Sons, Inc.
  • Kei Terayama; Koki Hongo; Hitoshi Habe; Masa-aki Sakagami
    Proceedings 3rd IAPR Asian Conference on Pattern Recognition ACPR 2015 361 - 365 2015年 [査読有り]
     
    We propose a visual tracking method for dense fish schools in which occlusions occur frequently. Although much progress has been made for tracking multiple objects in video images, it is challenging to track individuals in highly dense groups. For occluded fishes, estimation of their positions and directions is difficult. However, if we know the number of fishes in a local area, we can accurately estimate their states by matching all of the combinations of possible parameters on the basis of our appearance model. We apply the idea to track multiple fishes in a school. Experimental results show that multiple fishes are practically tracked with our method compared to a well-known tracking method, and the average difference is less than 4% of the mean body length of the school.
  • Hitoshi Habe; Kohei Kajiwara; Ikuhisa Mitsugami; Yasushi Yagi
    2013 SECOND IAPR ASIAN CONFERENCE ON PATTERN RECOGNITION (ACPR 2013) 775 - 778 2013年 [査読有り]
     
    When we act in a group with family members, friends, colleagues, each group member often play the respective role to achieve a goal that all group members have in common. This paper focuses on leadership among various kinds of roles observed in a social group and proposes a method to estimate a leader based on an interaction analysis. In order to estimate a leader in a group, we extract pointing actions of each person and measure how other people change their actions triggered by the pointing actions, i.e. how much influence the pointing actions have. When we can see the tendency that one specific person makes pointing actions and the actions have a high influence on another member, it is very likely that the person is a leader in a group. The proposed method is based on this intuition and measures the influence of pointing actions using their motion trajectories. We demonstrate that the proposed method has a potential for estimating the leadership through a comparison between the computed influence measures and subjective evaluations using some actual videos taken in a science museum.
  • Hitoshi Habe; Yasutoshi Nakamura
    MACHINE VISION AND APPLICATIONS 23 2 313 - 325 2012年03月 [査読有り]
     
    This paper proposes a method of camera calibration that compares the appearance of two images. Unlike conventional methods that evaluate point-to-point correspondences, ours makes a dense evaluation of the correspondence between two images. This enables us to robustly and efficiently calibrate range finders that are camera based. We explain the main principles and algorithm underlying our method, and we also present the results obtained from simulations and experimentally obtained data.
  • Mitsuru Nakazawa; Ikuhisa Mitsugami; Yasushi Makihara; Hozuma Nakajima; Hitoshi Habe; Hirotake Yamazoe; Yasushi Yagi
    2012 21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012) 469 - 472 2012年 [査読有り]
     
    This paper proposes a novel method to reconstruct dynamic scenes by integrating depth data obtained by multiple Kinects, which cannot be synchronized to one another In this method, the multiple Kinects located so as to cover the whole surface are firstly calibrated so that their depth data are mapped into the world coordinate system. The synchronous depth data for each Kinect is then generated by interpolation of temporally neighboring captured data. Experimental results of marching person reconstruction show the effectiveness of our method.
  • Hozuma Nakajima; Yasushi Makihara; Hsu Hsu; Ikuhisa Mitsugami; Mitsuru Nakazawa; Hirotake Yamazoe; Hitoshi Habe; Yasushi Yagi
    2012 21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012) 3803 - 3806 2012年 [査読有り]
     
    In this paper we propose a method for temporal interpolation of a point cloud undergoing occlusions and topological changes. The point cloud is first merged into fine clusters, which are then further merged into coarse clusters for each source and target shape. In conjunction with trash box bins to cope with occlusions, a coarse correspondence between a source and a target shape is found that minimizes the transportation cost in the earth mover's distance framework. Subsequently, a fine correspondence is found in a similar way based on the coarse correspondence constraint to suppress locally isolated motion. Finally, the source and target point clouds are transported based on the fine correspondence. Experiments with point cloud sequences captured by a Kinect range finder show promising results.
  • Hirotake Yamazoe; Hitoshi Habe; Ikuhisa Mitsugami; Yasushi Yagi
    2012 21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012) 465 - 468 2012年 [査読有り]
     
    This paper proposes a depth measurement error model of consumer depth cameras such as Microsoft KINECT, and its calibration method. These devices are originally designed for video game interface, thus, the obtained depth map are not enough accurate for 3D measurement. To decrease these depth errors, several models have been proposed, however, these models consider only camera-related parameters. Since the depth sensors are based on projector-camera systems, we should consider projector-related parameters. Therefore, we propose the error model of the consumer depth cameras especially the KINECT, considering both intrinsic parameters of the camera and the projector To calibrate the error model, we also propose the parameter estimation method by only showing a planar board to the depth sensors. Our error model and its calibration are necessary step for using the KINECT as a 3D measuring device. Experimental results show the validity and effectiveness of the error model and its calibration.
  • 中島 秀真; 満上 育久; 山添 大丈; 波部 斉; 槇原 靖; 八木 康史
    日本バーチャルリアリティ学会論文誌 17 3 209 - 217 特定非営利活動法人 日本バーチャルリアリティ学会 2012年 [査読有り]
     
    Existing background subtraction methods often fail to extract a foreground region whose color is similar to that of the background. When we use a co-located camera and range sensor, by which we can obtain both a color image and depth map simultaneously, it is expected to get a better foreground region by integrating the two kind of images. However, it is not straightforward when a moving object is observed because the camera and range sensor do not capture the scene synchronously. In this paper, we propose a novel method that pseudo-synchronize the camera and range sensor and integrate the background subtraction of the color and depth images to realize a good foreground extraction. Experimental results of a walking human show its effectiveness.
  • 波部 斉; 牧山 彰太; 木戸出 正繼
    電気学会論文誌. D, 産業応用部門誌 = The transactions of the Institute of Electrical Engineers of Japan. D, A publication of Industry Applications Society 131 4 557 - 564 一般社団法人 電気学会 2011年04月 [査読有り]
     
    In this paper, we propose a method for producing an informative wide-range composite image of a target object from a video taken by a camera moving parallel to the ground plane. Generally, when one generates an image that presents the scene in a video, it is difficult to select the information to be shown in the generated image from the large amount of information contained in the video. Our method involves the use of trajectories of feature points for selecting informative regions and generates a composite image on the basis of the trajectories. First, we create a 3D volume by piling up frame images on a time line. Second, we set a curved surface in that volume. Finally, a wide-range image is formed by considering the pixels along the curved surface. Our method selects a curved surface that passes through a large number of feature points of the target object. Therefore, we obtain an informative wide-range composite image of the target object from a video. By performing experiments with some actual videos, we verified that our method can generate an informative wide-range image of the target object effectively.
  • Hitoshi Habe; Shota Makiyama; Masatsugu Kidode
    Proceedings - International Conference on Pattern Recognition 4117 - 4120 2010年 [査読有り]
     
    We describe a method for generating an informative wide-view image using images captured by a moving camera. The generated image allows for events in the scene observed by the camera to be understood easily. Our method does not use 3D shape information explicitly. Instead, it employs the trajectory of feature points across multiple images and generates a composite image by taking into account the distribution of the trajectories of the feature points. © 2010 IEEE.
  • Hitoshi Habe; Hidehito Nakagawa; Masatsugu Kidode
    IPSJ Transactions on Computer Vision and Applications 2 145 - 155 2010年 [査読有り]
     
    This paper proposes a method for acquiring the prior probability of human existence by using past human trajectories and the color of an image. The priors play an important role in human detection as well as in scene understanding. The proposed method is based on the assumption that a person can exist again in an area where he/she existed in the past. In order to acquire the priors efficiently, a high prior probability is assigned to an area having the same color as past human trajectories. We use a particle filter for representing and updating the prior probability. Therefore, we can represent a complex prior probability using only a few parameters. Through experiments, we confirmed that our proposed method can acquire the prior probability efficiently and use it to realize highly accurate human detection. © 2010 Information Processing Society of Japan.
  • Itaru Tatsumi; Hitoshi Habe; Masatsugu Kidode
    Proceedings of the International Conference on Document Analysis and Recognition, ICDAR 1016 - 1020 2009年 [査読有り]
     
    Large-print textbooks are used by low vision students in school. Because these books are mainly prepared by volunteers and almost all steps in the preparation process are performed manually, they cannot be mass-produced. The chronic shortage of these books has been a social problem in Japan. The procedure for preparing a large-print textbook involves (1) converting the size of figures and characters in the original textbook to one suitable for low vision students and (2) positioning them appropriately on the pages. In this paper, we propose a novel method for automatically optimizing a layout by employing a context structure. We represent the context structure by using a graph called a context structure graph. The proposed method first allocates each material to an appropriate page, and then optimizes the layout of each page by using the sequence-pair method. Throughout these operations, we employ an objective function derived from the context structure graph to ensure that the context in the original textbook is preserved in the large-print textbook prepared. © 2009 IEEE.
  • Hitoshi Habe; Hidehito Nakagawa; Masatsugu Kidode
    2009 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION WORKSHOPS (CVPR WORKSHOPS 2009), VOLS 1 AND 2 982 - 988 2009年 [査読有り]
     
    This paper reports a method for acquiring the prior probability of human existence by using past human trajectories and the color of an image. The priors play important roles in human detection as well as in scene understanding. The proposed method is based on the assumption that a person can exist again in an area where he/she existed in the past. In order to acquire the priors efficiently, a high prior probability is assigned to an area having the same color as past human trajectories. We use a particle Iter for representing the prior probability. Therefore, we can represent a complex prior probability using only a few parameters. Through experiments, we confirmed that our proposed method can acquire the prior probability efficiently and it can realize highly accurate human detection using the obtained prior probability.
  • Retno Supriyanti; Hitoshi Habe; Masatsugu Kidode; Satoru Nagata
    ICICI-BME: 2009 INTERNATIONAL CONFERENCE ON INSTRUMENTATION, COMMUNICATION, INFORMATION TECHNOLOGY, AND BIOMEDICAL ENGINEERING 96 - + 2009年 [査読有り]
     
    The increasing number of cataract sufferers is a serious problem because cataracts are a leading cause of blindness in the world. To avoid blindness from cataracts, we need to detect them early. Today, ophthalmologists use a slit lamp to diagnose cataracts. This equipment is expensive and requires special training to use it. Unfortunately, a lot of developing countries have a limited number of ophthalmologists and health facilities, while a lot of cataract sufferers live in developing countries. Our algorithm is aimed at such developing countries and rural areas, and its main equipment is a compact digital camera. This equipment is inexpensive and easy for anyone to use without special training. Examination can be easily carried out in an outpatient department. We have already proposed a cataract screening method for the equipment that considers about specular reflection and statistical texture appearance inside the pupil. However, in order to accomplish our goal, not only the screening method itself, but also other aspects such as compactness and ease of use are crucial. In this paper, we will discuss system design for a compact cataract screening system. The final goal of our research is developing a simple and robust screening system for cataract with a compact digital camera. A user simply takes a patient's photograph and the system will automatically analyze the image by extracting information inside a pupil, including specular reflection analysis and texture appearance analysis, for distinguishing between serious and non-serious conditions. We emphasize how to implement our system in real conditions by giving a recommendation for acquiring appropriate image data while taking a photograph so that our system will work well. The results in a real implementation are similar to our recommendation.
  • Hitoshi Habe; Kazuhisa Honda; Masatsugu Kidode
    2009 THIRD ACM/IEEE INTERNATIONAL CONFERENCE ON DISTRIBUTED SMART CAMERAS 425 - 432 2009年 [査読有り]
     
    We propose a method that analyzes interaction between pedestrians based on their trajectories obtained using sensors such as cameras. Our objective is to understand the mutual relationship between pedestrians and to detect anomalous events in a video sequence. Under such situations, we can observe the interaction between a pair of pedestrians. This paper proposes a set of features that measures the interaction between pedestrians. We assume that a person is likely to change his/her walking patterns when he/she has been influenced by another person. Based on this assumption, the proposed method first extracts the transition points of a walking pattern from trajectories of two pedestrians and then measures the strength of the influence using the temporal and spatial closeness between them. Finally, experimental results obtained from actual videos demonstrate the method's effectiveness in understating mutual relationships and detecting anomalous events.
  • Cataract Screening by Specular Reflection and Texture Analysis
    Retno Supriyanti; Hitoshi Habe; Masatsugu Kidode; Satoru Nagata
    Communications of SIWN 6 59 - 64 2009年
  • 波部 斉; 佐伯 信雄; 松山 隆司
    電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 91 11 2684 - 2695 一般社団法人電子情報通信学会 2008年11月 
    没入型投影ディスプレイシステムなどで用いられる凹面スクリーン上に映像を投影したとき,相互反射や表面反射特性の影響で,入力された映像の明暗パターンがひずんで鑑賞者へ提示される.本論文では,これらの影響を補償し意図する映像を忠実に再現する手法を提案する.原理的には,プロジェクタ(光源)からスクリーン,鑑賞者とたどるライトトランスポートを求め,その逆変換を施すことで反射ひずみ補償が達成され,いくつかの例が提案されている.しかし,それらは本来面積をもった画素同士の対応であるライトトランスポートを,点同士の対応関係として近似的に定式化しているため,近似誤差によって反射ひずみを正しく補償できない場合がある.提案手法は,単純な点対応で生じる,単位入射光を投影したときの直接反射と相互反射の境界部分の急激な明度変化が観測できないという問題に対し,プロジェクタとカメラの間の幾何的対応関係をとり,幾何変換を行った上でライトトランスポートを求める.これにより,凹面スクリーンの幾何形状に応じたコンパクトなライトトランスポートで反射ひずみ補償が可能となった.
  • Retno Supriyanti; Hitoshi Habe; Masatsugu Kidode; Satoru Nagata
    MEDICAL IMAGING 2008: COMPUTER-AIDED DIAGNOSIS, PTS 1 AND 2 6915 2008年 [査読有り]
     
    The high prevalence of cataracts is still a serious public health problem as a leading cause of blindness, especially in developing countries with limited health facilities. In this paper we propose a new screening method for cataract diagnosis by easy-to-use and low cost imaging equipment such as commercially available digital cameras. The difficulties in using this sort of digital camera equipment are seen in the observed images, the quality of which is not sufficiently controlled; there is no control of illumination, for example. A sign of cataracts is a whitish color in the pupil which usually is black, but it is difficult to automatically analyze color information under uncontrolled illumination conditions. To cope with this problem, we analyze specular reflection in the pupil region. When an illumination light hits the pupil, it makes a specular reflection on the frontal surface of the lens of the pupil area. Also the light goes through the rear side of the lens and might be reflected again. Specular reflection always appears brighter than the surrounding area and is also independent of the illumination condition, so this characteristic enables us to screen out serious cataract robustly by analyzing reflections observed in the eye image. In this paper, we demonstrate the validity of our method through theoretical discussion and experimental results. By following the simple guidelines shown in this paper, anyone would be able to screen for cataracts.
  • 波部斉; 松山隆司; 白水健介; 小林俊彦
    画像ラボ, Vol.18, No.2【解説論文】 18 2 25 - 30 日本工業出版 2007年
  • 波部 斉; 白水 健介; 小林 俊彦; 松山 隆司
    電子情報通信学会論文誌. D, 情報・システム 89 9 2065 - 2074 一般社団法人電子情報通信学会 2006年09月 
    画像計測において,単独の画像では得られない情報を補う手法として,多重画像の利用が広く行われている.その中で,本論文では多重光源画像を用いた2種類の画像計測手法を提案する.多重光源画像を用いた従来手法では,正確な形状計測を行うため,表面の反射特性の厳密なモデル化や大掛りな装置が必要とされており,実環境への適用は容易ではない.それに対し本論文では,精密なモデルを用いず,多重光源画像での明度変化に着目して計測対象の大まかな三次元情報を計測する手法を提案する.まず第一の手法では,光源位置を変化させたときの画素値の変化からトンネル壁画のひび割れを検出する.第二の手法では,鉄道道床でのステレオマッチングの精度を向上させるために,様々な方向から照明を照射した画像を統合して利用する.本論文ではこれらの手法の原理及びアルゴリズムを述べ,実画像を用いた実験でその有効性を示す.
  • Takashi Matsuyama; Toshikazu Wada; Hitoshi Habe; Kazuya Tanahashi
    Systems and Computers in Japan 37 4 77 - 88 2006年04月 [査読有り]
     
    Background subtraction is widely used as an effective method for detecting moving objects in a video image. However, background subtraction requires a prerequisite in that image variation cannot be observed, and the range of application is limited. Proposed in this research paper is a method for detecting moving objects by using background subtraction that can be applied to cases in which the image has varied due to varying illumination. This method is based on two object detection methods that are based on different lines of thinking. One method compares the background image and the observed image using invariant features of illumination. The other method estimates the illumination conditions of the observed image and normalizes the brightness before carrying out background subtraction. These two methods are complementary, and highly precise detection results can be obtained by ultimately integrating the detection results of both methods. © 2006 Wiley Periodicals, Inc.
  • 曽良 洋介; 波部 斉; 松山 隆司
    映像情報メディア学会誌 : 映像情報メディア 60 4 553 - 560 2006年04月 
    3-D video records dynamic 3-D visual events as is. Applications of 3-D video include wide varieties of human activities. For promoting these applications in everyday life, a standardized compression scheme for 3-D video is required. We developed a practical and effective scheme for representing and compressing 3-D video named "skin-off," in which both the geometric and visual information are efficiently represented by cutting a 3-D mesh and mapping it onto a 2-D array. Skin-off has much in common with geometry images proposed by Gu et al. However, while geometry images use only 3-D surface ...
  • 波部斉; 鷲見和彦; 松山隆司
    電子情報通信学会論文誌 D J89-D 2 2006年
  • 波部 斉; 山澤 一誠; 野村 敏男
    電子情報通信学会論文誌. A, 基礎・境界 = The IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences (Japanese edition). A / 電子情報通信学会 編 88 9 1074 - 1084 一般社団法人電子情報通信学会 2005年09月
  • 松山 隆司; 和田 俊和; 波部 斉; 棚橋 和也
    電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 84 10 2201 - 2211 一般社団法人電子情報通信学会 2001年10月 
    背景差分は, 画像中の移動対象を検出する有効な手法として広く利用されている.しかし, 背景差分を行うには, 背景部分での画像の変化が観測されないという前提条件が必要であるため, その適用範囲は限られている.本論文では, 照明変化による背景部分の画像の変化が起きた場合にも適用可能な背景差分による移動対象検出法を提案する.本手法は, 異なった考え方に基づく二つの対象検出法に基づいている.一方は, 照明に不変な特徴を用いて背景画像と観測画像の比較を行う手法である.他方は, 背景差分を行う前に観測画像の照明条件を推定し, 輝度の正規化を行う手法である.これら二つの手法は互いに相補的であり, 最終的に双方の検出結果を統合することで精度の高い検出結果を得ることができる.実験の結果, 実画像に対する本手法の有効性が示された.

書籍

  • オブジェクト指向Javaプログラミング入門 第2版
    多田昌裕; 半田久志; 加藤 暢; 波部 斉 (担当:共著範囲:第2章)近代科学社 2018年03月 ISBN: 9784764904958
  • Human-Harmonized Information Technology, Volume 2
    Toyoaki Nishida (担当:分担執筆範囲:Behavior Understanding Based on Intention-Gait Model)Springer 2017年 ISBN: 9784431565352
  • 統計的学習の基礎―データマイニング・推論・予測―
    杉山 将; 井手 剛; 神嶌 敏弘; 栗田 多喜夫; 前田 英作監訳; 井尻 善久; 井手 剛; 岩田 具治; 金森 敬文; 兼村 厚範; 烏山 昌幸; 河原 吉伸; 木村 昭悟; 小西 嘉典; 酒井 智弥; 鈴木 大慈; 竹内 一郎; 玉木 徹; 出口 大輔; 冨岡 亮太; 波部 斉; 前田 新一; 持橋 大地; 山田 誠 (担当:共訳範囲:第15章 ランダムフォレスト)共立出版 2014年06月 ISBN: 432012362X
  • コンピュータビジョン ―アルゴリズムと応用―
    玉木 徹; 福嶋 慶繁; 飯山 将晃; 鳥居 秋彦; 栗田 多喜夫; 波部 斉; 林 昌希; 野田 雅文 (担当:共訳範囲:第4章:特徴検出とマッチング)共立出版 2013年03月 ISBN: 432012328X
  • Utilization of Portable Digital Camera for Detecting Cataract
    Rerno Supriyanti; Hitoshi Habe; Masatsugu Kidode (担当:共著範囲:Ocular Diseases)INTECH 2012年09月
  • バイオメトリックセキュリティ・ハンドブック
    オーム社 2006年

MISC

産業財産権

  • 特許6433033:建方支援システム及び建方支援システムに用いられるモバイル機器    2018年12月05日
    奥野 勝司, 山田 泰史, 田中 達, 波部 斉, 内藤 充洋, 谷山 英臣, 藤井 伸元  株式会社きんそく, テクノス株式会社, 学校法人近畿大学
  • 特許5305409:白内障検査装置、白内障検査方法、および白内障判定プログラム    2013年07月05日
    木戸出正繼, 波部斉, レトノ スプリヤンティ, 永田啓
  • 特許5210203:画像の差分による高精度ステレオカメラキャリブレーション    2013年03月01日
    中村泰敏, 波部斉
  • 特願PCT/JP2005/022686:3次元画像データ圧縮装置、該方法、該プログラム及び記憶媒体  
    波部斉, 松山隆司, 曽良洋介
  • 特開2004-86341:道路交通流計測装置  
    波部斉, 富田浩朗
  • 特開2002-358595:道路交通流計測装置および道路交通流計測方法  
    波部斉, 関真規人

受賞

  • 2020年05月 電子情報通信学会 ISS活動功労賞
  • 2017年08月 画像の認識・理解シンポジウムMIRU2017 論文評価貢献賞
     
    受賞者: 波部 斉
  • 2016年08月 画像の認識・理解シンポジウムMIRU2016 Outstanding Reviewer
     
    受賞者: 波部 斉
  • 2012年05月 電子情報通信学会 ISS査読功労賞
     
    受賞者: 波部斉
  • 2009年02月 コニカミノルタ画像科学振興財団 画像科学奨励賞
     
    受賞者: 波部斉
  • 2008年02月 SPIE SPIE Medical Imaging 2008 Honorable Mention Poster Award
     
    受賞者: 波部斉

共同研究・競争的資金等の研究課題

  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2023年04月 -2027年03月 
    代表者 : 波部 斉
  • 日本学術振興会:科学研究費助成事業 学術変革領域研究(A)
    研究期間 : 2021年09月 -2026年03月 
    代表者 : 川嶋 宏彰
  • 日本学術振興会:科学研究費助成事業 新学術領域研究(研究領域提案型)
    研究期間 : 2019年04月 -2021年03月 
    代表者 : 波部 斉
     
    鳥や魚などの生物の集団として振る舞いは長く研究対象として注目されてきたが,群行動を精緻に計測し,群れのナビゲーションのメカニズムを解明する試みは限られている.そこで,群になって行動している生物を撮影した映像からその動きを獲得するための「汎用映像処理プラットフォーム」を構築してきた.本年度の研究実績の概要は以下のとおりである. (1) 魚の検出・追跡に関する基礎技術の構築 まず,水槽の中を遊泳する魚の検出を行うために,環境変化に対応して魚を高精度で検出する手法を考案した.この手法では水槽に設置されている器具や水面の照り返しで水面が観測できない領域を泳ぐ魚の様子を周囲から予測する機能も実装している.また,魚の動きをより詳細に知るために,その姿勢をパラメトリックに表現するモデルを導入し,そのパラメータを精度良く推定する方法を考案した.この手法は姿勢の時系列変化をモデル化できるので,異常検知や姿勢変化の予測への活用が期待できる. (2) コウモリの生態観測のための3次元計測 新学術領域「生物移動情報学」に参加している生態学を専門とする研究者と協力して,飛翔するコウモリの3次元軌跡を推定する手法を考案した.この手法では洞窟から出現するコウモリをステレオカメラで計測し,画像処理による検出,カメラ間の対応付け,3次元軌跡の復元を行っている.これによって,トンネルから出現するコウモリの尾数の傾向や,複数のコウモリが協調して飛行する様子を詳細に観測できるようになると期待される.また,コウモリが飛翔している暗い空間の中でもその位置を精度良く得るための手法を考案し,その基本的有効性を確認した.
  • 日本学術振興会:科学研究費(基盤研究(C))
    研究期間 : 2017年 -2020年 
    代表者 : 波部 斉
     
    本研究では顔向き変化に着目し,主に,不審者検出への応用を中心に画像処理技術の開発とその検証を実施した.顔検出および顔向き変化の推定は,それぞれの分野において現在最高水準の精度を持つとされている,TinyFaceとDeepgazeを用い,そこから得られた時系列の顔向きデータを利用して,人物の意図,特に不審行動をとっている人物の推定を行った.時系列の顔向きデータの中から,他と比べて特異な動きをしている人物や,不自然に大きな動きをしている人物を特定し,それが不審行動をとっている人物とすることにした.この手法の有効性を検証するために,スタジアムでの観客席を想定した映像データセットで実験を行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2014年04月 -2019年03月 
    代表者 : 延原 章平; 川嶋 宏彰; 波部 斉; 松山 隆司
     
    本研究は水中環境における多視点カメラ・プロジェクタ群を用いた3次元形状・運動計測を目的として,屈折を伴う撮像課程のモデル化,効率的な投影計算アルゴリズムの考案,微小物体を対象とした新たな光学系の設計,およびこれらの周辺技術としての水中物体の検出,追跡技術に取り組んだものであり,特に球面レンズと複合鏡を組み合わせた反射屈折光学系によって微小物体の多視点撮影および3次元形状計測が可能であることを実証した点に新規性・独創性を有する.
  • 文部科学省:科学研究費(新学術領域研究)
    研究期間 : 2017年 -2018年 
    代表者 : 波部 斉
     
    課題A:大規模群泳行動の自動計測 本研究では,(a) 映像中で群になって泳ぐ魚を検出・追跡する技術,(b) 検出した魚の姿勢をモデル化し時間経過に伴うその動きを獲得する技術,の開発を行った.2018年度はマイワシはクロマグロだけでなく,コウモリやメダカ,人物などへの適用を行った.現状では(b)の技術の適用先はマイワシに限定されているが,(a)はクロマグロ成魚などの大きな個体に対しても対応できるように拡張し,様々な対象に対して有効に動作することを確認した. 課題B:群泳行動データセットの構築 水族館や水産養殖場で収集した映像を用い,(a)映像データ,(b)それぞれに映っている個体の位置,を対にしたデータセットの構築を行った.対象は先述のクロマグロ成魚・クロマグロ稚魚・マイワシとし,それらについて位置データを人の眼で付与し,それを組みとしてデータセットとした.2018年度はこれまでに不足していた環境条件(暗い場合やバースト現象のバリエーション)を補うことを念頭におき,データセットを拡張した. AとBに共通して「生物移動情報学」の他の研究班との協力を密にして実施した.先のコウモリに映像解析はその一例である. また,これらの成果を広く一般にアピールするために,佐世保市の九十九島水族館 海きららにおいて,2018年9月に一般向けの研究発表会「九十九島の日 研究発表会」を九十九島水族館と共同で実施した.40名の参加者を得て好評のうちに終了した.
  • 歩容意図行動モデルに基づいた人物行動解析と心を写す情報環境の構築
    科学技術振興機構:CREST
    研究期間 : 2010年10月 -2016年03月 
    代表者 : 八木康史
  • 文部科学省:科学研究費補助金(基盤研究(C))
    研究期間 : 2013年 -2015年 
    代表者 : 波部 斉
     
    画像・映像の中に含まれている物体の認識を行うためには,対象となる環境において大量のサンプルを取得して機械学習を行うアプローチが主流である.しかし,実際の応用場面では必ずしも常に大量の学習サンプルを獲得できる訳ではない.そこで,異なる環境で収集したデータを用いて学習した識別器を用いて新たな環境において精度の高い識別を行う手法を提案した.実環境において収集したデータを用いて検証を行ったところ提案手法が有効に動作することがわかった.
  • 文部科学省:科学研究費補助金(若手研究(B))
    研究期間 : 2011年 -2012年 
    代表者 : 波部 斉
     
    本研究において鍵となるアイデアである「場所依存コンテクストを用いた人物検出」および「場所依存コンテクストを用いた人物相互関係モデリング」について基礎検討を行った.その結果得られた成果は以下の通りである.まず,「場所依存コンテクストを用いた人物検出」については,その基本となるランダム・フォレストを用いたアンサンブル学習について,基礎的な検討を行ってきた.まず,ランダム・フォレストを一般的な画像認識・コンピュータビジョンに適用したときの課題およびその解決法について調査・検討した.その成果については,2012年5月に情報処理学会CVIM研究会において報告する予定である.その成果を踏まえて,本研究において鍵となる,人物検出に適用した場合の場所依存コンテクストの表現・学習・利用の方法について検討を開始した,そのために必要なデータについては,当初2~3カ所で撮影することを予定したが,幸い10カ所で撮影することができたので,それを活かした検討を行っているところである.次いで,人物相互関係モデリングについても基礎検討を行った.そこでは,まず人の目で人物の相互関係を観察して本研究の用途に適した情報があるかどうかを確認した.先に述べた10カ所のカメラ映像の中から,典型的な例を選んで詳細に確認したところ,シーンの中での人通りに応じて人同士の距離が変わったり,シーン中に何か興味を引く物があればそこに人が立ち止まることが多いことが確認できた.これらを適切に表現することによって,人物相互関係モデリングが可能になると期待される.
  • デジタルカメラを使用した発展途上国向け白内障スクリーニング装置の開発
    科学技術振興機構:平成21年度シーズ発掘試験
    研究期間 : 2009年 -2009年
  • 文部科学省:科学研究費補助金(若手研究(B))
    研究期間 : 2007年 -2009年 
    代表者 : 波部斉
     
    ビデオカメラを用いて撮影した屋外シーンの中に含まれる物体の検出・認識・追跡を精度よく行うことを最終目的とし,シーンの幾何構造,すなわち,地面や建物などの構造を利用する様々な手法を開発した.具体的には,(1)過去に人物が移動した軌跡から地面など人物がよく歩く部分を求める手法を開発し,それを用いて(2)蓄積した映像から人物の移動軌跡を精度よく求める手法を考案した.さらに,求めた移動軌跡を利用したより高度な処理を目指して,(3)人物間インタラクションの解析手法を提案した.
  • 自律機能と遠隔対話を融合した知的インタラクションに基づく対話ロボットの開発
    NEDO:戦略的先端ロボット要素技術開発プロジェクト 高齢者対応コミュニケーションRTシステム(サービスロボット分野)
    研究期間 : 2008年 -2008年
  • デジタルカメラによる簡便な白内障スクリーニングシステムの開発
    奈良先端科学技術大学院大学支援財団:平成20年度NAIST発新産業創出支援事業
    研究期間 : 2008年 -2008年
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2005年 -2007年 
    代表者 : 中村素典; 波部斉; 中村裕一; 岡部寿男
     
    1.安定高信頼伝送手法の開発:高い信頼性と低いコストを両立させるために、安価なベストエフォートネットワークを複数用意し、併用あるいは切り替える仕組みを実現することが有効である。通常用いられるUDPには通信帯域の制御機構や通信状況の把握機構が備わっていない。その対策として輻輳制御機構を備えたTFRC(TCP Friendly Rate Control)を活用し、複数のパスを併用した効果的な伝送制御手法について研究開発した。また、SCTP(Stream Control Transmission Protocol)を利用し障害を検出した際に迅速に経路を切り替えることによって、映像・音声の伝送を極力途切れさせないようにするための手法について研究開発した。2.4地点遠隔講義環境の実現:4拠点を結ぶ遠隔講義を実施するにあたってDVTSによるストリーミング伝送される映像を合成・選択することが可能な多地点制御装置(MCU:Multipoint Control Unit)を導入するとともに、映像選択・提示を効果的かつ効率良く行うために、ユーザインタフェースの開発を行った。これを利用することにより、遠隔講義に参加する拠点数の増減に柔軟に対応できるようになるとともに、講師がいる拠点が変わっても容易に対応ができ、また、画面合成・選択の制御がどの拠点からも制御できるようになり、遠隔講義の実施支援がより...
  • 映像からの移動対象検出のための適応的背景映像モデリング
    (財)立石科学技術振興財団:研究助成
    研究期間 : 2006年 -2006年
  • 文部科学省:科学研究費補助金(特定領域研究(C), 特定領域研究)
    研究期間 : 2001年 -2005年 
    代表者 : 松山隆司; 杉本晃宏; 佐藤洋一; 川嶋宏彰; 鷲見和彦; 波部斉; 牧淳人
     
    21世紀社会では,ネットワーク結合された情報システムと人間とが一体となって様々な活動を行うことが望まれ,そのためには従来の「命令-応答モデル」を超えた新たなインタラクション・モデルの構築が必要となる.本研究では,そのような次世代のインタラクション・モデルとして「人間と共生する情報システム」というコンセプトを提案した.「人間と共生する情報システム」は,人間からの命令を受けて動くだけでなく,情報システム自身が自律的に人間の行動や意図を理解し,それに基づいて人間への情報提供を自発的に行うといった双方向の動的インタラクションを実時間で行えることが必要となる.こうした問題意識に基づき本研究では,「人間と共生する情報システム」を実現するための基盤研究として,視覚情報処理の観点から以下の課題に焦点を当てて研究を推進し,理論モデルから実世界インタラクションシステムの開発まで幅広い成果を得た.1.「人を観る」(認識系):実世界環境に埋め込まれたカメラネットワークおよび装着型能動視覚センサによって人間の3次元動作や視線情報を計測し,それらに基づいて意図・行動理解を行うシステムを開発した.2.「人を魅する」(生成系):日常生活環境における多様な情報操作・提示システムとして,プロジェクタによる机上への情報表示と両手を用いた情報操作機能を備えたインテリジェント・デスクを開発した.3.「人と交わる」(イ...
  • 文部科学省:科学研究費補助金(若手研究(B))
    研究期間 : 2003年 -2004年 
    代表者 : 波部斉
     
    昨年度に行った検討では,画像パターンの微小な変化が線形モデルに従うときに,背景と対象と識別が可能であることを示したが,本年度は,任意の画像パターンに対してその変化を効率的に記述する手法の検討を行った.この手法では,画像パターンの自己相関に着目し,画像上で観測された変化と自己相関を比較することで,観測された変化が動的シーンでみられる揺らぎによるものなのか,検出対象によるものなのかを識別する.従来の手法では,処理対象の画像が持つ2次元空間構造,すなわち2次元の隣接関係には着目せずに,画像を単なる1次元データとして扱うものが多く,そのために性能に限界があったと考えられる.これに対し,本手法で着目する自己相関は2次元空間構造を現したものであり,これを利用することで精度の向上が期待される.本年度はこの考え方に基づく手法の基本的な有効性を確認した.この考え方は,動的環境下の対象検出のみならず,画像解析の様々な面に応用が可能である.その一例として,画像同士のマッチングにおけるサブピクセル単位での変位推定に応用を試みた.対象検出が,画像に発生した変動が対象によるものかどうかを識別する問題であったのに対し,サブピクセル推定は画像の変動からその変位を精密に推定する問題と位置づけることができる.すなわち,平行移動による画像の変化を精密にモデル化する,という面では本質的に同様の問題であるといえる.こ...
  • 文部科学省:科学研究費補助金(基盤研究(A))
    研究期間 : 2001年 -2003年 
    代表者 : 松山隆司; 杉本晃宏; 和田俊和; 東海彰吾; 川嶋宏彰; 波部斉; 杉本晃宏; 和田俊和
     
    3次元ビデオ映像の能動的実時間撮影・圧縮・編集・表示法の開発を目指して、平成13年度〜15年度の3年間の研究により以下の成果を得た。(1)Myrinet高速ネットワークでPC30台を結合し、IEEE1394首振りカメラ25台を持つ能動的実時間3次元ビデオ映像撮影用PCクラスタシステムを開発した。(2)首振りカメラを準視点固定型パン・チルト・ズームカメラとしてモデル化し、高精度にキャリブレーションを行う手法を開発した。(3)3平面視体積交差法およびPCクラスタを用いた並列パイプライン処理システムを開発し、毎秒10フレームを超える処理速度で人体動作の3次元ディジタル化を実現した。(4)より高精度な3次元形状復元、高精細テクスチャマッピングの実現を目指した、人体部位の分散協調的ズームアップ撮影のための多視点カメラワークの最適化法を考案した。(5)視体積交差法で得られた3次元形状の復元精度向上のため、弾性メッシュモデルの動的変形による高精度3次元形状復元アルゴリズムを開発した。(6)対象の観察視点・視線情報を利用した高品質テクスチャマッピングアルゴリズムを考案した。(7)複数のランバーシアン参照球を用いた光環境センシシグ法(複数光源の推定法)を考案した。(8)スケルトン・キューブ(枠のみからなる立方体)を用いたセルフシャドウに基づく光環境センシング法を考案した。(9)3次元ビデオと全...

委員歴

  • 2021年04月 - 2025年03月   情報処理学会   コンピュータビジョンとイメージメディア研究運営委員会(CVIM) 幹事
  • 2022年07月 - 2023年08月   画像の認識・理解シンポジウムMIRU2023   広報委員長
  • 2020年07月 - 2021年08月   画像の認識・理解シンポジウムMIRU2021   広報委員長
  • 2020年09月 - 2021年07月   画像センシングシンポジウムSSII2021   実行委員(財務部会長)
  • 2019年05月 - 2021年03月   情報処理学会   コンピュータビジョンとイメージメディア研究運営委員会(CVIM) 運営委員
  • 2017年05月 - 2019年05月   情報処理学会   関西支部幹事
  • 2019年05月   International Conference on Machine Vision Applications 2019 Publication Chair
  • 2017年06月   画像センシングシンポジウムSSII2017実行委員(オーガナイズドセッション部会)
  • 2017年05月   IAPR International Conference on Machine Vision Applications 2017   Publication Chair
  • 2016年06月   画像センシングシンポジウムSSII2016実行委員(広報部会・オーガナイズドセッション部会)
  • 2014年05月 - 2016年05月   電子情報通信学会   関西支部支部運営委員
  • 2015年06月   画像センシングシンポジウムSSII2015実行委員(広報部会長)
  • 2011年05月 - 2015年05月   電子情報通信学会   情報・システムソサイエティ英文論文誌編集委員
  • 2015年05月   IAPR International Conference on Machine Vision Applications 2017   Tutorial Co-Chair
  • 2013年06月   第20回画像センシングシンポジウムSSII2014 実行委員(広報部会)
  • 2012年05月 - 2013年05月   IAPR MVA 2013   Web Co-Chair
  • 2012年03月 - 2012年11月   ACM MM2012   Local Arrangement Committee Member
  • 2010年   第16回画像センシングシンポジウムSSII2010 査読委員
  • 2010年   MIRU2010 画像の認識・理解シンポジウム 査読委員
  • - 2009年   ASTEM(財団法人 京都高度技術研究所)非常勤特別研究員(2008年度〜2009年度)
  • 2009年   MIRU2009 画像の認識・理解シンポジウム 査読委員
  • - 2004年   JEITA(社団法人 電子情報技術産業協会)3DMM規格検討委員会委員(2003年度〜2004年度)
  • 第15回画像センシングシンポジウムSSII09 プログラム委員(インタラクティブ&オーラルセッション部会)

担当経験のある科目

  • コンピュータビジョン近畿大学情報学部
  • 知能システムプロジェクト1近畿大学情報学部
  • 機械学習1近畿大学情報学部
  • プログラミング基礎2近畿大学情報学部
  • コンピュータビジョン特論近畿大学大学院総合理工学研究科
  • パターン認識近畿大学理工学部
  • 微分積分学II近畿大学理工学部
  • 信号処理近畿大学理工学部
  • 情報メディア同志社大学
  • 人工知能論奈良先端科学技術大学院大学
  • システムプログラミング概論奈良先端科学技術大学院大学
  • プログラミング演習奈良先端科学技術大学院大学
  • 知的システム構築論奈良先端科学技術大学院大学
  • ディジタル信号処理近畿大学理工学部

その他のリンク

researchmap



Copyright © MEDIA FUSION Co.,Ltd. All rights reserved.