human-data-lib は、人間由来バイオデータ解析に関わる OSS や公式の公開リポジトリで確認できるライブラリ、ツール、標準、ワークフロー、プラットフォームを一つの機械可読カタログとして整理します。
「全部」を扱うための現実的な方針は、完全列挙を主張することではなく、次の条件を満たす入口を作ることです。
採録対象には、狭義のライブラリだけではなく、実務上の解析選定に必要な周辺成果物も含めます。
library: Python/R/Java/C++ などから呼び出す再利用可能コードtool: CLI や GUI で使う解析ツールworkflow: 既成パイプラインworkflow-engine: パイプライン実行基盤standard: BIDS、FHIR、OMOP、CWL、WDL などの仕様platform: Web/desktop/server 型の解析・記録基盤ecosystem: Bioconductor、nf-core、OHDSI HADES などの集合体優先順位は次の通りです。
不確かな情報は入れません。特に、最新バージョン、インストール数、引用数、ベンチマーク値は変動しやすいため、必要な場合だけ別途検証します。
psych-r のように生態系名を付けます。domains, modalities, tasks, ecosystems, scales は複数指定できます。
分類は厳密な階層ではなく、検索のためのタグです。例えば MNE-Python は neurophysiology、EEG、preprocessing、Python を同時に持てます。
scales は次の値を中心に使います。
molecular: ゲノム、転写、タンパク質、代謝物、マイクロバイオームなどcellular: single-cell、cytometry、細胞画像、細胞状態などtissue: 組織、病理、spatial omics などorgan-system: 脳、心血管、睡眠、医用画像、生体信号などwhole-person: 個人単位の行動、心理、質問紙、アウトカムなどbehavioral: 実験課題、移動、反応時間、行動ログなどclinical: EHR、FHIR、OMOP、臨床ノート、医用画像などpopulation: コホート、疫学、公衆衛生、集団遺伝などenvironmental: 曝露、地理空間、移動、建成環境などinfrastructure: 標準、ワークフロー、データモデル、プライバシー基盤など次の項目は原則として入れません。
summary_ja は 1 文で、何のデータに何をするものかを簡潔に書きます。宣伝文句ではなく、用途が分かる実務的な文にします。