human-data-lib

人間由来バイオデータ解析のためのライブラリ、ツール、標準、ワークフローを横断的に整理するリポジトリです。

公開ページ: https://www.yasufumi.net/human-data-lib/

対象は OSS や公式の公開リポジトリで確認できるものに限定します。「人類が作った全部」を厳密に列挙することは公開情報だけでは不可能なので、本リポジトリでは 公開ページで読めるカタログ検索できる Python/CLI 実装 として管理します。

このページの目的

このページは、人間由来データを扱う解析ソフトウェアを探すための入口です。ゲノムや single-cell のようなミクロなデータから、EHR、医用画像、ウェアラブル、疫学、環境曝露、人口規模データのようなマクロなデータまで、公開リポジトリで確認できる解析資産を同じ形式で並べています。

収録対象は「使える名前の一覧」ではなく、後から検証・検索・比較できる台帳です。各項目には、分野、データ種別、処理タスク、実行環境、解析スケール、公式 URL、公開 repo URL、日本語要約を持たせています。

まず見る場所

このサイトで見られるもの

開発者向けには、同じ内容を元データと Python/CLI からも利用できます。

収録状況

2026-05-20 時点の継続更新カタログは 549 件です。代表的な収録軸は以下です。

2026-05-20 の更新では、nf-core 個別 workflow、HTS/GA4GH/HL7/RO-Crate/CWL provenance などの標準、OME/OMERO と pathology/bioimaging、fNIRS/EEG/fMRI/DICOM/physiology、FHIR/OMOP 周辺 platform、population genetics、疫学、公衆衛生、mobility、built environment / thermal exposure の公開 repo を横断的に追加しました。

対象領域

継続更新カタログは、公式の公開リポジトリを確認できる代表的な公開エコシステムを中心に、ミクロからマクロまでの尺度を含みます。

分野としては次を広く含みます。

使い方

開発環境から直接実行できます。

PYTHONPATH=src python3 -m human_data_lib.cli validate
PYTHONPATH=src python3 -m human_data_lib.cli stats --facet domains
PYTHONPATH=src python3 -m human_data_lib.cli stats --facet scales
PYTHONPATH=src python3 -m human_data_lib.cli search single-cell --ecosystem Python
PYTHONPATH=src python3 -m human_data_lib.cli list --scale population
PYTHONPATH=src python3 -m human_data_lib.cli list --scale environmental
PYTHONPATH=src python3 -m human_data_lib.cli list --domain clinical-data --format markdown
PYTHONPATH=src python3 -m human_data_lib.cli show scanpy

検索例:

パッケージとして入れる場合:

python3 -m pip install -e .
human-data-lib search EEG --domain neurophysiology

Python から使う場合:

from human_data_lib import load_catalog

catalog = load_catalog()
entries = catalog.search("single-cell", ecosystem="Python")
for entry in entries:
    print(entry.id, entry.name, entry.official_url)

カタログの考え方

1 件の項目は、ライブラリだけではなく、ツール、標準仕様、ワークフロー、プラットフォーム、エコシステムも含みます。バイオデータ解析では、実務上「ライブラリ」だけを見ても再現性や運用が閉じないためです。

必須項目:

詳しくは docs/catalog-policy.mddocs/schema.md を参照してください。

追加方針

新しい項目を追加するときは、公式ページと公開リポジトリを確認し、不確かな最新バージョンや利用者数は書きません。ライセンスも確実に分かる場合だけ記入します。

make validate
make test

上記が通る状態を保ってください。

スコープ外

本リポジトリは、解析実装の選定、比較、監査、再現性確保を支援するための土台です。

継続更新

公開 OSS は常に増えるため、この一覧は固定版ではありません。平日 11 時に、新しく見落としている公開リポジトリがないかを確認する運用にします。追加候補が見つかった場合は、公式ページと公開 repo URL を確認したうえでカタログ、ドキュメント、検証結果を更新します。