Skip to content

t46/ssa

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Social Science Research Automation (SSA)

World Values Survey Wave 7 (2017-2022) の米国データを用いた社会科学研究の自動化パイプライン

概要

本プロジェクトは、World Values Survey (WVS) のデータを活用し、以下のプロセスを完全自動化します:

  • データ前処理とセマンティック検索の準備
  • LLMによる研究アイデアの創出
  • 統計分析コードの自動生成と実行
  • 学術論文の自動執筆とPDF生成

詳細な処理フローについては ai/social_science_research_automation.md を参照してください。

セットアップ

1. 環境変数の設定

# .envファイルを作成
cp .env.example .env

# 以下の環境変数を設定
# ANTHROPIC_API_KEY_SSA=your_anthropic_api_key

2. 依存関係のインストール

# 依存関係のインストール
uv sync

# 開発ツールの実行
uv run ruff format .  # フォーマット
uv run ruff check . --fix  # リント
uv run pyright  # 型チェック

クイックスタート

1. データの準備

Google Driveからデータをダウンロードし、data/ディレクトリに配置してください。

2. パイプラインの実行

# パイプライン全体の実行
uv run run_pipeline.py

このコマンドで以下が自動実行されます:

  1. WVSデータのダウンロードと前処理: TODO
  2. セマンティック検索の準備: TODO
  3. 研究テーマの自動生成
  4. 統計分析の実行
  5. 論文の自動執筆とPDF化

プロジェクト構造

ssa/
├── data/
│   ├── raw/          # 生データ(WVS公式サイトからダウンロード)
│   └── processed/    # 前処理済みデータ
├── code-maps/        # 質問票・コードブックのJSONマッピング
├── meta-data/        # 変数名などのメタデータ
├── spec/             # 研究仕様・変数マッピング
├── outputs/          # 分析結果・論文
├── ai/               # プロジェクト仕様書
└── src/              # ソースコード
    ├── generate_research_ideas.py    # 研究アイデア生成
    ├── generate_and_execute_analysis.py  # 分析コード生成・実行
    ├── generate_paper.py             # 論文生成
    ├── terminal_formatter.py         # ターミナル出力フォーマット
    └── tools/
        ├── search_papers.py          # 論文検索ツール
        └── semantic_search.py        # セマンティック検索ツール

使用データ

World Values Survey Wave 7 (2017-2022)

  • 対象国:米国(B_COUNTRY = 840)
  • サンプルサイズ:約1,500人
  • 調査項目:政治・宗教・経済・幸福感など多岐にわたる価値観

技術スタック

  • Python 3.11+
  • uv (パッケージ管理)
  • pytest (テスト)
  • ruff (リンター/フォーマッター)
  • pyright (型チェック)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages