Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add torch example. #415

Open
wants to merge 26 commits into
base: develop/v2
Choose a base branch
from
Open

Conversation

KanaiYuma-aist
Copy link
Collaborator

  • examples/torch/MNIST を追加しました。

@KanaiYuma-aist KanaiYuma-aist changed the base branch from main to develop/v2 January 7, 2025 07:52
@KanaiYuma-aist
Copy link
Collaborator Author

ABCI3.0でのテスト実行を行いました。
ABCI3.0ではデフォルトで使えるpythonが 3.9 になっており、そのままだと aiaccel がインストールできなかったので、
暫定で singularity を利用して、 python3.10 のコンテナを利用してインストール・実行を行いました

@KanaiYuma-aist
Copy link
Collaborator Author

  • train.sh の資源タイプを HG に変更しました
  • DDP 用のコンフィグとスクリプトを追加しました(config_ddp.yaml train_ddp.sh)
  • logger の設定を True にしました

@KanaiYuma-aist
Copy link
Collaborator Author

KanaiYuma-aist commented Jan 30, 2025

ABCI での aiaccel.torch のテスト実行中に MANIFEST.in の改修が必要なことが判明したため、こちらに関して別でpull request を作成しました
#417

@KanaiYuma-aist
Copy link
Collaborator Author

開発者会議メモ

  • ユーザが base config を設定できるような実装を行った pull request を先に作成する
    • (一応ドキュメントは完成させてから、そちらに移行する)

@KanaiYuma-aist KanaiYuma-aist marked this pull request as ready for review February 7, 2025 05:49
@KanaiYuma-aist
Copy link
Collaborator Author

KanaiYuma-aist commented Feb 7, 2025

  • ABCI3.0 で singularity を用いた aiaccel(python3.10) の環境構築方法をドキュメントに記載しました
  • load_config の改修に合わせて、config の記法を改修しました
    • (config_ddp.yaml の base で、 aiaccel/torch/apps/config/train_ddp.yaml を利用しようとしたら print_config でエラーが発生したため、aiaccel/torch/apps/config/train_base.yaml を利用しました)

@KanaiYuma-aist KanaiYuma-aist changed the title (WIP)Add torch example. Add torch example. Feb 7, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant