Ich suche nach Informationen darüber, wie ein Python Machine Learning-Projekt organisiert werden soll. Für Python übliche Projekte gibt es Cookiecutter und für R ProjectTemplate .
Dies ist meine aktuelle Ordnerstruktur, aber ich mische Jupyter Notebooks mit tatsächlichem Python-Code und es scheint nicht sehr klar zu sein.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Ich arbeite im Skriptordner und füge derzeit alle Funktionen in Dateien unter my_module hinzu, aber das führt zu Fehlern beim Laden von Daten (relative / absolute Pfade) und anderen Problemen.
Ich konnte keine geeigneten Best Practices oder guten Beispiele zu diesem Thema finden, abgesehen von einigen Kaggle-Wettbewerbslösungen und einigen Notebooks, bei denen alle Funktionen zu Beginn eines solchen Notebooks zusammengefasst waren.