合成人口データ
地域の世帯構成を、公開されている統計に基づいてプライバシーに配慮して合成します。
合成人口データとは
合成人口データ(Synthetic Population)とは、公開されている統計をもとに合成した世帯単位の仮想的な個票データのことです。都道府県、市区町村、町丁目を単位とする小地域の統計を考慮して合成していますが、各小地域に合成された世帯は小地域内でランダムに配置されており、データセットごとに同じ座標の世帯でも配置されている世帯は異なっています。
本研究室では、以下のような世帯単位の個票データを合成しています。各世帯には年齢、性別、世帯内の役割、雇用形態、産業分類、企業規模、所得の属性情報と共に都道府県・市区町村・町丁目・位置座標の位置情報が格納されています。なお、データ提供にあたっては、セキュリティレベル表のレベルに応じて、位置情報の粒度を考慮して提供しています。
人口合成手法
合成人口データの世帯構成は、仮想空間に合成された世帯の各構成員の属性に基づいて計測された統計値と、公開されている実際の統計値との誤差が最小化されるように、世帯構成員の属性を入れ替えることによって合成されています。具体的には、対象地域の総世帯を仮に合成し、それらの世帯の属性値を入れ替える組合せ最適化を、Simulated Annealing法という探索的人工知能手法を用いて行なっています。
本研究室のデータを利用される場合は、以下の論文を参照ください。
Tadahiko Murata, Takuya Harada, Daiki Masui, Comparing Transition Procedures in Modified Simulated-Annealing-Based Synthetic Reconstruction Method without Samples, SICE Journal of Control, Measurement, and System Integration, Vol.10, No.6, pp. 513-519, 2017
人口データの合成にあたっては、学際大規模情報基盤共同利用・共同研究拠点(JHPCN)、革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の支援を受けています。
計算資源をご提供いただいた大阪大学と北海道大学で広報資料を作成していただきました。
大阪大学サイバーメディアセンター HPSC News ビデオ(2019年7月)
北海道大学情報基盤センター iiC HPC 広報誌(2020年3月)
基本的な人口合成に加えて、さまざまな属性を追加する手法については以下のような研究を行なっています。
家族構成、構成員の性別、年齢を含む世帯合成
[H19] 講演会優秀発表賞,原田拓弥,村田忠彦,「出生コーホートによる出生数を考慮した人口個票の合成」,計測自動制御学会システム・情報部門学術講演会(千葉大学、11月23-25日、2019), pp.554-559, 2019.
[H18] 原田拓弥,村田忠彦,「出生コーホートを考慮した日本全国の仮想個票の合成」,計測自動制御学会第18回社会システム部会研究会資料(沖縄,3月17-19日,2019), 6 pages,2019.
[H17] 原田拓弥,村田忠彦,「世帯合成法における世帯構成員の年齢と役割を考慮した初期世帯と近傍解生成法の改良」,計測自動制御学会 システム・情報部門 学術講演会資料(富山国際会議場, 11月25-27日, 2018), GS06-02 (6ページ), 2018.
[H16] Tadahiko Murata, Takuya Harada, “Synthetic Method for Population of A Prefecture Using Statistics of Local Governments, Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2018 (Miyazaki, Japan, Oct. 7-10, 2018), pp. 1171-1176, 2018.
[H15] 原田拓弥,村田忠彦,「市区町村の統計表を考慮した都道府県単位の仮想個票の合成」,計測自動制御学会第15回社会システム部会研究会資料(沖縄,3月14-16日,2018), pp. 30-35, 2018.
[H14] 原田拓弥,村田忠彦,枡井大貴,「家族類型と世帯内の役割を考慮したSA法による大規模世帯の復元」,計測自動制御学会論文誌,Vol. 54, No. 9, pp. 705-717,2018.
[H13] Tadahiko Murata, Takuya Harada, Daiki Masui, “Comparing transition procedures in modified simulated-annealing-based synthetic reconstruction method without samples”, SICE Journal of Control, Measurement, and System Integration, vol. 10, no. 6, pp. 513-519, 2017.
[H12] Tadahiko Murata, Takuya Harada, “Nation-Wide Synthetic Reconstruction Method,” Proc. of 2017 IEEE Symposium Series on Computational Intelligence (Hawaii, USA, Nov.27–Dec. 1, 2017), pp.596-601, 2017.
[H11] 枡井大貴,村田忠彦,「統計データからの市民属性復元のための進化計算とSAによる2段階最適化」,システム制御情報学会論文誌,Vol. 30, No. 6, pp. 216-227, 2017.
[H10] 枡井大貴,村田忠彦,原田拓弥,「市民属性の合成手法における年齢交換による誤差最小化」,計測自動制御学会第12回社会システム部会研究会資料(グアム,3月3 – 5日,2017),pp.31-39,2017.
[H9] Tadahiko Murata, Takuya Harada, Daiki Masui, “Modified SA-based Household Reconstruction from Statistics for Agent-Based Social Simulations,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2016 (Budapest, Hungary, Oct. 9-12, 2016), pp. 3600-3605, 2016.
[H8] Daiki Masui, Tadahiko Murata, “A two-fold simulated annealing to reconstruct household composition from statistics,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2015 (Hong Kong, China, Oct. 9-12, 2015), pp. 1133-1138, 2015.
[H7] Tadahiko Murata, Daiki Masui, “Designing simulated annealing and evolutionary algorithms for estimating attributes of residents from statistics,” Proc. of IEEE International Conference on Evolutionary Computation (Sendai, Japan, May 25-28, 2015), pp. 2476-2481, 2015.
[H6] 枡井大貴,村田忠彦,「エージェント属性復元における Simulated Annealingを用いた世帯構成の最適化」,計測自動制御学会第8回社会システム部会研究会資料(宮古島,3月13 -15日,2015),pp. 167-172,2015.
[H5] 枡井大貴,村田忠彦,「統計データを用いたエージェント属性生成における誤差最小化のための進化計算手法」,進化計算学会進化計算シンポジウム2014講演論文集(広島,12月20-21日,2014),8 pages,2014.
[H4] 枡井大貴,村田忠彦,「統計データとの誤差最小化のためのSAによるエージェント属性復元」,計測自動制御学会第7回社会システム部会研究会資料(小樽,9月8-9日,2014),pp. 47-52,2014.
[H3] Tadahiko Murata, Daiki Masui, “Estimating agents’ attributes using simulated annealing from statistics to realize social awareness,” Proc. of IEEE International Conference on System, Man & Cybernetics: SMC 2014 (San Diego, USA, Oct. 5-8, 2014), pp. 717-722, 2014.
[H2] 枡井大貴,村田忠彦,「SAを用いた統計データからのエージェント属性復元のための目的関数の影響」,計測自動制御学会第5回社会システム部会研究会資料(石垣島,3月5-7日,2014),pp. 121-126,2014.
[H1] 枡井大貴,村田忠彦,「公開統計データを用いた世帯構成員の特徴量の進化計算的推計手法」,進化計算学会進化計算シンポジウム2013講演論文集(鹿児島,12月14-15日,2013),7 pages,2013.
所得,産業分類,就業形態を加えた世帯合成
[I4] 杉浦翔,村田忠彦,原田拓弥,「賃金構造基本統計調査に基づく合成世帯集団の労働者への所得の割当て」,システム制御情報学会論文誌,Vol. 32, No. 2, 10 pages, 2019.
[I3] Tadahiko Murata, Sho Sugiura, Takuya Harada, “Income allocation to each worker in synthetic populations using basic survey on wage structure,” Proc. of 2017 IEEE Symposium Series on Computational Intelligence, pp. 471-476, 2017.
[I2] 杉浦翔,村田忠彦,原田拓弥,「就業形態を考慮した合成人口の労働者への所得の割り当て」,計測自動制御学会第15回社会システム部会研究会資料(沖縄,3月14-16日,2018), pp. 179-186,2018.
[I1] 杉浦翔,村田忠彦,「産業分類ごとに就業状態を考慮した個々の世帯への所得の割当」,計測自動制御学会 システム・情報部門 学術講演会資料(静岡大学浜松キャンパス, 11月25-27日, 2017)6ページ, 2017.
位置情報を加えた世帯合成
[P5] 原田拓弥,村田忠彦,「基本単位区集計を用いた位置情報属性追加手法の精緻化」,計測自動制御学会 システム・情報部門 学術講演会資料(富山国際会議場, 11月25-27日, 2018), GS06-03 (6ページ), 2018.
[P4] 原田拓弥,村田忠彦,「SA法による仮想個票の住居への建築の時期属性の付加手法の検討」,計測自動制御学会システム・情報部門学術講演会資料(静岡大学浜松キャンパス, 11月25-27日, 2017)6ページ, 2017.
[P3] 論文賞: Takuya Harada, Tadahiko Murata, “Projecting household of synthetic population on buildings using fundamental geospatial data”, SICE Journal of Control, Measurement, and System Integration, Vol. 10, No. 6, pp. 505-512, 2017.
[P2] Takuya Harada, Tadahiko Murata, “Projecting Synthetic Households on Buildings Using Fundamental Geospatial Data,” Proc. of Social Simulation Conference 2017 (Dublin, Ireland, Sep. 25-29, 2017), 10 pages, 2017.
[P1] 研究会最優秀論文賞: 原田拓弥,村田忠彦,「基盤地図情報による合成した世帯構成への位置情報の付加」,計測自動制御学会第12回社会システム部会研究会(グアム,3月3-5日,2017), pp. 1-6, 2017.
従業地情報を加えた世帯合成
[W3] 福田希海,村田忠彦,「居住地と従業地の距離を考慮した従業地割当手法」,計測自動制御学会第33回社会システム部会研究会(2024年3月)
[W2] Tadahiko Murata, Daiki Iwase, Takuya Harada, Workplace Assignment to Workers in Synthetic Populations in Japan, IEEE Transactions on Computational Social Systems, Vol. 10, No. 4, pp. 1914-1923, Aug. 2023
[W1] 研究会優秀賞受賞:岩瀬大輝,村田忠彦,原田拓弥,「合成人口データにおける常住地人口規模を考慮した就業者の従業地の割当て」,計測自動制御学会第27回社会システム部会研究会(オンライン,3月6-8日,2022),pp.10-17,2022.
移動交通手段を加えた世帯合成
[T2] 堀上駿太,村田忠彦,「合成人口データを用いた就業者の通勤手段割当手法の改良」,計測自動制御学会第33回社会システム部会研究会(2024年3月)
[T1] 北下慎太郎,村田忠彦,「合成人口データを活用した就業者の通勤手段・通勤経路・所要時間の推定」,計測自動制御学会第27回社会システム部会研究会(オンライン,3月6-8日,2022),pp.101-108,2022.