社会学におけるWebマイニング - 理系のための備忘録

「Webマイニング」とは

「Webマイニング」とは、ウェブ上にあるデータやコンテンツ、テキスト情報を収集し、目的に沿った有用な情報を抽出する処理のことで、鉱山から鉱石を掘り起こす「マイニング」に準えて作られた語です。

膨大な情報源からデータのマイニングを行うことを「データマイニング」と呼びます。データマイニングで得られる情報は、大きく以下の４つに分類されます。

1. データ（Data）：整理されていない数値
2. 情報（Information）：「データ」を整理・カテゴライズしたもの
3. 知識（Knowledge）：「情報」から得られる傾向・知見
4. 知恵（Wisdom）：「知識」を利用して人が判断する力

これは「DIKWモデル」と呼ばれる分類法で、1980年代に検討された思考モデルであり、Data（生データ）、Information（情報）、Knowledge（知識）、Wisdom（知恵）の頭文字から命名されています。

データマイニングをWeb上で行うことから「Webマイニング」と呼ばれています。具体的な内容については「データマイニングとは？基本の考え方から分析手法、仕組みを解説！」という「ITトレンド」さんの記事が分かりやすいです。

「Webマイニング」を利用した研究の大雑把な流れは、①膨大なソースから大量のデータを収集する（マイニング）、②プログラム等による解析に利用できる形に収集したデータを整形する（クレンジング）、③数理的･統計的な手法を用いて有用な結果を引き出す（アナライズ）、という手順で進められます。

社会学におけるWebマイニングの参考資料

「計算社会科学におけるWebマイニング」
（人工知能学会全国大会2018チュートリアル講演資料）
Fujio Toriumi 氏

計算社会科学におけるWebマイニング from Fujio Toriumi

雑記Topに戻る

管理人便り (2026/01/04記)

明けましておめでとうございます。今年は午年ですね。

本年は「丙午（ひのえうま）」にあたり、六十干支の中でもとりわけ強いエネルギーが巡る年と言われます。江戸時代には「丙午の年は火災が多い」といった迷信が広まり（八百屋お七の物語なども相まって）、この干支にはどこか良くない印象がつきまとってきましたが、それも今は昔。

陰陽五行では「丙（ひのえ）」は「火」の「兄（え）」、すなわち「陽の火」を意味します。また「馬」は十二支の中でも特によく走り、力強さの象徴とされます。昨年には日本初の女性総理も誕生しました。この勢いにあやかり、私たちも前向きに駆け抜ける一年にしたいものです。

●　　●　　●

当サイトについてのご意見・ご要望はトップメニューバーの「その他」→「お問い合わせ」のページからお寄せ下さい。お待ちしております！

《ページの表示について》
当サイトを閲覧するときはJavaScriptを有効化して下さい。スマートフォンの場合、ブラウザや機種、ネット通信環境によってはKaTeXの立ち上がり（数式の表示）にやや時間が掛かることがあります。

《リンク付け・引用について》
当サイトへのリンク付けは自由にして頂いて構いませんが、その際に管理人まで一声掛けて頂けると更新の励みになります。
また、特に断りが無い限り、投稿記事・固定ページを含むすべての内容の著作権は当サイト･運営者に帰属します。当サイトの記事等の内容を引用する際は必ず出典とリンク（URL）を記載して下さい。宜しくお願いいたします。

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30