Title: 2020年 mawi-wg活動報告書 Author(s): 長 健二朗 (kjc@iijlab.net) Date: 2021-01-08 1. MAWI WG について MAWI(Measurement and Analysis on the WIDE Internet)ワーキンググループ は、ネットワークデータの収集と解析を研究対象とした活動を行なっている。 MAWI WGではWIDEプロジェクトの特徴を活かした研究をするため、 「広域」「多地点」「長期的」の三つの項目に重点を置いたトラフィックの計 測・解析を行っている。 広域バックボーンでのデータ収集はバックボーンを持っているWIDEだからでき る事である。分散管理されるインターネットの状態を把握するためには、多地 点で観測したデータを照らし合わせることが欠かせない。また、長期的にデー タを収集し蓄積するために、ワーキンググループとしての継続的な活動が役に 立つ。 計測技術はほとんどの研究分野で必要となるため、MAWIワーキンググループは WIDE内の他のワーキンググループと連係をとりながら活動をしている。 また、グローバルなインターネットの挙動を把握するために、海外の組織とも 積極的に協調して研究活動をしている。 WIDEプロジェクトは多くの国際協調活動を行なっているが、近年は計測研究の 重要性が増している。これは、インターネット研究において、グローバルなレ ベルでその挙動を把握する必要性と難しさが認識されてきたためである。 また、これまで行ってきたデータ解析研究は、ビッグデータ解析との共通点が 多く、今後より広い分野への応用が期待されている。 2. MAWI WG 2020年度の活動概要 2.1 WIDEトランジットトラフィック概要 MAWIワーキンググループでは、トラフィックを多次元集約するagurimツール を開発し、2013年2月よりWIDEのトランジット回線のトラフィックを継続的に 記録している。 2015年5月には、ツールをオープンソースとして公開し、同時 に、IPアドレスを匿名化したWIDEのトランジット回線のトラフィックデータを Webインターフェイスでブラウズ可能にした。 これによって、ネットワーク運 用者や研究者が、バックボーンのトラフィック状況の詳細をブラウズできるよ うになり、トラフィック情報の共有や研究の促進に繋がることを期待している。 2020年全体を通して、平均のトラフィック量は317Mbps、パケット量は94kpps 程度であった。コロナ禍でほとんどの大学ではキャンパスへの立ち入りが制限 されていた影響もあり、トラフィック量は前年の70%程度になっている。 個別の集約フローを見ると、集約されたネットワークに加えて、いくつかのホ ストが識別されている。 (wide-memo-mawi-agurim2020-00.pdf 参照) 2.2 ブロードバンドトラフィックの収集と解析 トラフィック量を把握することは、今後を予想する上で、また技術やインフラ への投資を考える上で欠かせない。 なかでも、トラフィックの増加率は長期 的な計画を立てる際に重要である。 日本国内のインターネットのトラフィック量の集計は、WIDEのメンバーが中心 になって、国内ISP9社ならびに総務省の協力を得て、2004年から継続的に行わ れている活動である。 2020年は、新型コロナウイルス感染拡大の影響で、インターネットの利用に 大きな変化が起こった。 特に、4月上旬から 5月下旬にかけての緊急事態宣 言中には、ほとんどの人が外出を控えてオンラインで活動を行っていた影響で トラフィック量が大幅に増えた。 (wide-memo-mawi-traffic2020-00.pdf 参照) 2.3 その他の活動 MAWI-WGでは、上で報告した以外にも、トラフィック解析、DNS解析、BGP解析、 セキュリティ解析、機械学習を用いた異常検出などの研究活動を行っている。 (論文リスト参照) 3. まとめ 2020年は新型コロナウイルス感染拡大で大きな社会変化が起こったが、この変 化を支えたのはインターネットだった。 WIDEの計測研究活動として、この変化を技術的側面から把握し、将来に備える ために役立てることが我々の使命だと考えている。 4. 論文リスト [1] Ha Dao, K.Fukuda. "A machine learning approach for detecting CNAME cloaking-based tracking on the Web". IEEE Globecom. December 2020. [2] S.Kobayashi, Y.Yamashiro, K.Otomo, K.Fukuda. "amulog: A General Log Analysis Framework for Diverse Template Generation Methods". IEEE/IFIP CNSM. November 2020. [3] Romain Fontugne, Anant Shah, Kenjiro Cho. "Persistent Last-mile Congestion: Not so Uncommon". ACM IMC 2020. October 2020. [4] P.Mulinka, P.Casas, K.Fukuda, L.Kencl. "HUMAN - Hierarchical Clustering for Unsupervised Anomaly Detection and Interpretation". NoF 2020. October 2020. [5] Romain Fontugne, Ksenia Ermoshina, Emile Aben. "The Internet in Crimea: a Case Study on Routing Interregnum". Global Internet Symposium 2020. Paris, France. June 2020. [6] Arun. Dunna, Zachary Bischof, Romain Fontugne. "Sanitizing a View of Consumer Broadband in the United States". IEEE/IFIP TMA 2020. June 2020. [7] H.Dao, J.Mazel, K.Fukuda. "Characterizing CNAME Cloaking Based Tracking on the Web". IEEE/IFIP TMA 2020. June 2020. [8] K.Fukuda, Y.Yoneya, T.Mitamura. "Towards detecting DNSSEC validation failure with passive measurements". IEEE/IFIP AnNet 2020. April 2020. [9] 新津雄大,小林諭,福田健介,江崎浩. "大規模 IPv6 アドレスの収集・分析". 電子情報通信学会論文誌. June 2020. [10] G.Hu, K.Fukuda. "Toward Detecting IoT Device Traffic in Transit Networks". ICAIIC2020, February 2020.