World Values Survey Wave 7 (2017-2022) の米国データを用いた社会科学研究の自動化パイプライン
本プロジェクトは、World Values Survey (WVS) のデータを活用し、以下のプロセスを完全自動化します:
- データ前処理とセマンティック検索の準備
- LLMによる研究アイデアの創出
- 統計分析コードの自動生成と実行
- 学術論文の自動執筆とPDF生成
詳細な処理フローについては ai/social_science_research_automation.md を参照してください。
# .envファイルを作成
cp .env.example .env
# 以下の環境変数を設定
# ANTHROPIC_API_KEY_SSA=your_anthropic_api_key# 依存関係のインストール
uv sync
# 開発ツールの実行
uv run ruff format . # フォーマット
uv run ruff check . --fix # リント
uv run pyright # 型チェックGoogle Driveからデータをダウンロードし、data/ディレクトリに配置してください。
# パイプライン全体の実行
uv run run_pipeline.pyこのコマンドで以下が自動実行されます:
- WVSデータのダウンロードと前処理: TODO
- セマンティック検索の準備: TODO
- 研究テーマの自動生成
- 統計分析の実行
- 論文の自動執筆とPDF化
ssa/
├── data/
│ ├── raw/ # 生データ(WVS公式サイトからダウンロード)
│ └── processed/ # 前処理済みデータ
├── code-maps/ # 質問票・コードブックのJSONマッピング
├── meta-data/ # 変数名などのメタデータ
├── spec/ # 研究仕様・変数マッピング
├── outputs/ # 分析結果・論文
├── ai/ # プロジェクト仕様書
└── src/ # ソースコード
├── generate_research_ideas.py # 研究アイデア生成
├── generate_and_execute_analysis.py # 分析コード生成・実行
├── generate_paper.py # 論文生成
├── terminal_formatter.py # ターミナル出力フォーマット
└── tools/
├── search_papers.py # 論文検索ツール
└── semantic_search.py # セマンティック検索ツール
World Values Survey Wave 7 (2017-2022)
- 対象国:米国(B_COUNTRY = 840)
- サンプルサイズ:約1,500人
- 調査項目:政治・宗教・経済・幸福感など多岐にわたる価値観
- Python 3.11+
- uv (パッケージ管理)
- pytest (テスト)
- ruff (リンター/フォーマッター)
- pyright (型チェック)