architect/arh/analysis/2026-02-19-file-types/FILE_TYPES_ANALYSIS.md

Анализ типов файлов платформы

Дата: 2026-02-19
Версия: 1.0.0


СВОДКА

Зона Всего файлов Уникальных типов Топ-3 типа
ПЛАТФОРМА 8,761 47 .md (592), .py (297), .yaml (178)
└─ architect/ 276 3 .md (267), .yaml (6), .gitkeep (3)
└─ system/ 5,887 45 .js (2407), .json (2008), .ts (528)
└─ library/ 194 17 .py (122), .md (32), .pyc (30)
└─ infra/ 2,404 29 .gz (680), .br (680), .js (519)
ПРОЕКТЫ 22,904 120+ .py (8824), .js (2470), .md (2039)
ДАННЫЕ 4,078 43 .jpg (2198), .xlsx (285), .html (326)

ВСЕГО: 35,743 файла, 150+ уникальных типов


ПЛАТФОРМА (architect/, system/, library/, infra/)

По категориям

architect/ (276 файлов)

Тип Файлов % Где Примеры
.md 267 96.7% standards/, concept/, theory/ CLAUDE.md, README.md, PROTOCOL.md
.yaml 6 2.2% index.yaml architect/index.yaml
.gitkeep 3 1.1% research/ research/hypotheses/.gitkeep

Характеристика: Чистая документация. Методология, стандарты, шаблоны.


system/ (5,887 файлов)

Тип Файлов % Где Примеры
.js 2,407 40.9% node_modules/ system/monitor/node_modules/
.json 2,008 34.1% node_modules/, package.json system/monitor/package.json
.ts 528 9.0% agents/, cli/ system/agents/*.ts
.md 227 3.9% agents/, scripts/ system/agents/CLAUDE.md
.cjs 149 2.5% node_modules/
.py 114 1.9% scripts/, workers/ system/scripts/sessions.py
.map 83 1.4% node_modules/
.yaml 26 0.4% config/ system/config/*.yaml
.mts 25 0.4% node_modules/
.cts 22 0.4% node_modules/
.html 21 0.4% services/ system/services/file-share/index.html
.svelte 19 0.3% (если есть)
.mjs 19 0.3% node_modules/
Другие 280 4.8% .css, .sh, .yml, .service

Характеристика:
- 75% — зависимости Node.js (node_modules)
- 25% — код платформы (агенты, скрипты, сервисы)
- Основные языки: TypeScript, Python, JavaScript


library/ (194 файла)

Тип Файлов % Где Примеры
.py 122 62.9% connectors/, services/ library/connectors/api/telegram/init.py
.md 32 16.5% docs/ library/connectors/api/ozon/README.md
.pyc 30 15.5% pycache/
.txt 5 2.6% requirements.txt
.php 2 1.0% legacy/
.gz 2 1.0%
.yaml 1 0.5%

Характеристика:
- Чистый Python код
- Библиотеки компонентов (connectors, services)
- Минимум зависимостей


infra/ (2,404 файла)

Тип Файлов % Где Примеры
.gz 680 28.3% compressed assets
.br 680 28.3% compressed assets
.js 519 21.6% web-services/ infra/web/docs/
.css 156 6.5% web-services/
.md 90 3.7% scripts/, docs/ infra/scripts/README.md
.sh 64 2.7% scripts/ infra/scripts/backup.sh, cleanup.sh
.py 63 2.6% scripts/
.png 46 1.9% web-services/
.yaml 25 1.0% config/
.woff2 17 0.7% fonts/
.env 7 0.3% config/ infra/.env.example
Другие 77 3.2% .txt, .html, .conf, .service

Характеристика:
- 56.6% — статичные активы (сжатые .gz/.br)
- 28.1% — веб-интерфейсы (docs.0kt.ru, upload.0kt.ru)
- 15.3% — скрипты инфраструктуры


Сводка платформы

Группа Типы Файлов % Назначение
Документы .md, .txt 618 7.1% Документация, стандарты, README
Код Python .py, .pyc, .pyi 763 8.7% Библиотеки, скрипты, типизация
Код JavaScript/TS .js, .ts, .tsx, .jsx, .mjs, .cjs 3,523 40.2% Агенты, сервисы, node_modules
Конфиги .json, .yaml, .yml 4,240 48.4% Настройки, package.json, схемы
Web-ресурсы .html, .css, .less 542 6.2% Веб-сервисы, UI
Скрипты .sh 193 2.2% Bash-автоматизация
Сжатые .gz, .br 1,360 15.5% Статичные активы
Изображения .png, .svg, .jpg, .ico 146 1.7% Логотипы, иконки
Шрифты .woff2, .ttf 23 0.3% Веб-шрифты
Credentials .env, .key, .pem 15 0.2% Секреты (НЕ в git)

Принцип: ПЛАТФОРМА = только КОД. Без данных, без бинарников (кроме инфраструктурных активов).


ПРОЕКТЫ (projects/)

По проектам

projects/org/lideravto/ (специфика)

Тип Файлов % Где Назначение
.md 232 28.4% docs/ Документация проекта
.php 173 21.2% modules/, site/ CS-Cart модули
.less 166 20.3% themes/ Стили CS-Cart
.tpl 69 8.4% themes/ Шаблоны CS-Cart
.gz 32 3.9% backups/ Бэкапы
.sh 19 2.3% deployment/scripts/ Деплой-скрипты
.yaml 15 1.8% config/ Конфигурация
.tgz 15 1.8% backups/ Архивы
.xml 13 1.6% modules/ addon.xml
.png 9 1.1%
.py 8 1.0% scripts/ Утилиты
.css 8 1.0% themes/ Стили
.sql 4 0.5% database/schema/ Схемы БД
Другие 53 6.5%

Характеристика:
- E-commerce: CS-Cart (PHP + Smarty)
- Кастомные модули для автозапчастей
- Деплой-автоматизация


projects/org/pirotehnika/ (специфика)

Тип Файлов % Где Назначение
.py 6,436 63.8% app/, venv/ Python приложения + venv
.md 478 4.7% docs/ Документация
.pyi 321 3.2% venv/typeshed/ Типизация Python
.js 290 2.9% mp1/, bot/ Frontend
.jpg 156 1.5% (ДОЛЖНЫ быть в DATASPACE!) Изображения
.txt 138 1.4%
.pyx 100 1.0% venv/numpy/ Cython код
.so 92 0.9% venv/ Скомпилированные модули
.typed 73 0.7% venv/ PEP 561 markers
.pxd 69 0.7% venv/numpy/ Cython headers
.sql 62 0.6% app/pim/migrations/ Миграции БД
.pyc 61 0.6% pycache/ Байт-код
.json 54 0.5% config/ Конфиги
.csv 41 0.4% data/ Данные
.html 36 0.4% templates/ Шаблоны
.xlsx 32 0.3% (ДОЛЖНЫ быть в DATASPACE!) Таблицы
Другие 1,470 14.6% venv/ Numpy, pandas, deps

Характеристика:
- Python-heavy: FastAPI, Celery, ML
- Много venv (6000+ файлов) — numpy, pandas, scipy
- ⚠️ НАРУШЕНИЕ: 156 .jpg + 32 .xlsx в git (должны в DATASPACE)


projects/org/drupal-lab/ (специфика)

Тип Файлов Где Назначение
.twig много themes/ Drupal шаблоны
.php много modules/, themes/ Drupal код
.yml много config/ Drupal конфиги

Характеристика: Drupal CMS разработка


Сводка проектов

Группа Типы Файлов % Назначение
Код Python .py, .pyc, .pyi, .pyx, .pxd, .so, .typed 13,815 60.3% Приложения, venv
Код JS/TS .js, .ts, .tsx 3,295 14.4% Frontend, Node.js
Код PHP .php, .module, .install 545 2.4% CS-Cart, Drupal, OpenCart
Документы .md, .txt 2,845 12.4% Проектные доки
Конфиги .json, .yaml, .yml 1,945 8.5% Настройки приложений
Шаблоны .twig, .tpl, .html 643 2.8% Templates
Стили .css, .less, .scss 644 2.8% Стили
SQL .sql, .db 151 0.7% Схемы, миграции
Скрипты .sh, .bat 154 0.7% Деплой, автоматизация
Данные .csv, .xlsx, .xls, .json (большие) 232 1.0% ⚠️ Часть должна в DATASPACE
Изображения .jpg, .png, .svg 395 1.7% ⚠️ Часть должна в DATASPACE
Архивы .gz, .tgz, .zip 103 0.4% Бэкапы

⚠️ ПРОБЛЕМЫ:
- 156 .jpg в pirotehnika → перенести в DATASPACE
- 32 .xlsx в pirotehnika → перенести в DATASPACE
- venv в git (6000+ файлов) → должны быть в .gitignore


ДАННЫЕ ($DATASPACE — /mnt/beget-s3/)

По типам

Тип Файлов % Где Назначение
.jpg 2,198 53.9% projects/*/images/ Изображения товаров
.html 326 8.0% projects/*/html/ Парсинг, кеш
.pdf 326 8.0% projects/*/docs/ Документы
.xlsx 285 7.0% projects/*/inbox/, prices/ Прайс-листы, импорт
.csv 166 4.1% projects/*/data/ Данные
.xls 164 4.0% projects/*/inbox/ Старые прайс-листы
.md 113 2.8% projects/*/docs/ Документация
.py 75 1.8% projects/*/scripts/ Скрипты обработки
.gz 65 1.6% backups/ Бэкапы
.json 55 1.3% projects/*/cache/ Кеш, данные API
.mp4 46 1.1% media/ Видео
.pyc 24 0.6% pycache/
.txt 17 0.4%
.sh 16 0.4% scripts/
.png 16 0.4% images/
.sample 13 0.3%
.zip 12 0.3% archives/
.xlsx# 12 0.3% LibreOffice locks
.PDF 11 0.3% (дубли в верхнем регистре)
.ods 10 0.2%
.docx 10 0.2%
Другие 118 2.9% 20+ типов

Суммарный размер (оценка):
- .jpg: ~1.5-2 GB
- .xlsx/.xls: ~250 MB
- .pdf/.PDF: ~200 MB
- .mp4: ~500 MB

Характеристика:
- 75% — бинарные данные (изображения, документы, видео)
- 20% — структурированные данные (таблицы, CSV)
- 5% — код/скрипты обработки данных

✅ ПРАВИЛЬНО: Бинарные файлы в S3, не в git


ПОЛНЫЙ СПИСОК ТИПОВ (исчерпывающий)

1. ДОКУМЕНТЫ

.md — Markdown документы (5,413 файлов)

.ai.md — AI-агенты (34 файла)

.credentials.md — Credentials (9 файлов)

.txt — текстовые файлы (261 файл)

.rst — reStructuredText (8 файлов)


2. КОД

.py — Python код (9,231 файл)

.pyc — Python байт-код (124 файла)

.pyi — Python type stubs (333 файла)

.pyx, .pxd — Cython (105 + 70 файлов)

.js — JavaScript (5,408 файлов)

.ts — TypeScript (1,333 файла)

.tsx — TypeScript React (15 файлов)

.jsx — JavaScript React (редко)

.mjs, .cjs — ES Modules (42 + 162 файла)

.php — PHP код (381 файл)

.c, .cpp, .h, .hpp — C/C++ (57 + 32 + 93 + 26 файлов)

.so — Shared Objects (113 файлов)

.f90, .f — Fortran (60 + 24 файла)

.go — Go (9 файлов)


3. КОНФИГИ

.json — JSON конфиги (3,373 файла)

.yaml — YAML конфиги (2,099 файлов)

.yml — YAML (альтернативное расширение) (558 файлов)

.toml — TOML (1 файл)

.ini — INI конфиги (4 файла)

.conf — Конфиги (10 файлов)

.xml — XML (21 файл)

.eslintrc, .prettierrc, .jshintrc (30+ файлов)

.editorconfig (7 файлов)


4. СКРИПТЫ

.sh — Bash скрипты (193 файла)

.bash, .zsh (редко)

.bat, .cmd, .ps1 — Windows скрипты (9 + 2 + 11 файлов)


5. ДАННЫЕ

.csv — CSV таблицы (58 + 166 в DATASPACE)

.xlsx — Excel таблицы (36 + 285 в DATASPACE)

.xls — Excel старый формат (2 + 164 в DATASPACE)

.ods — LibreOffice Calc (10 в DATASPACE)

.sql — SQL скрипты (87 файлов)

.db, .sqlite — SQLite базы (3 файла)


6. ИЗОБРАЖЕНИЯ

.jpg, .jpeg — JPEG изображения (156 + 2198 в DATASPACE)

.png — PNG изображения (93 + 16 в DATASPACE)

.svg — SVG векторная графика (47 файлов)

.ico — Иконки (3 файла)

.webp — WebP (2 файла)


7. БАЗЫ ДАННЫХ

.db — SQLite базы (3 файла)


8. CREDENTIALS & SECURITY

.env — Environment переменные (10 файлов)

.key — Приватные ключи (2 файла)

.pem — SSL сертификаты (6 файлов)

.crt — SSL сертификаты (2 файла)


9. ВРЕМЕННЫЕ И КЕШ

.pyc — Python кеш (124 файла)

.log — Логи (25 файлов)

.tmp — Временные файлы

.cache — Кеш


10. СПЕЦИАЛЬНЫЕ (без расширения)

README, LICENSE, Makefile, Dockerfile


11. WEB

.html — HTML (405 + 326 в DATASPACE)

.css — CSS стили (320 файлов)

.less — LESS препроцессор (166 файлов)

.scss, .sass — SASS (редко)


12. ШАБЛОНЫ

.twig — Twig шаблоны (232 файла)

.tpl — Smarty шаблоны (94 файла)

.tmpl — Generic шаблоны (22 файла)

.j2 — Jinja2 шаблоны (6 файлов)


13. ШРИФТЫ

.woff2 — Web-шрифты (21 файл)

.woff — Web-шрифты (старый формат)

.ttf — TrueType шрифты (6 файлов)


14. АРХИВЫ

.gz — Gzip архивы (736 файлов)

.br — Brotli архивы (680 файлов)

.tgz, .tar — Tar архивы (15 файлов)

.zip — ZIP архивы (18 файлов)


15. МЕДИА

.mp4 — Видео (46 в DATASPACE)

.pdf, .PDF — PDF документы (326 + 11 в DATASPACE)

.docx, .doc — Word документы (10 в DATASPACE)

.rtf — Rich Text (2 в DATASPACE)


16. ДРУГОЕ

.map — Source maps (548 файлов)

.module, .install, .theme — Drupal (14 файлов)

.po, .pot — Gettext переводы (16 файлов)

.proto — Protocol Buffers (13 файлов)

.mako — Mako шаблоны (19 файлов)

.pak — PAK файлы (60 файлов)

.exe — Windows исполняемые (40 файлов)

.info — Info файлы (59 файлов)

.typed — PEP 561 markers (109 файлов)

.gitignore, .gitkeep, .gitattributes (11 + 6 + 2 файла)

.npmignore (14 файлов)

.deployed (26 файлов)


СПЕЦИФИКА ПО ЗОНАМ

Только в ПЛАТФОРМЕ

Тип Где Назначение
.ai.md system/agents/ AI-агенты
.less infra/web/ Стили (если нет в проектах)
.service infra/ Systemd юниты

Только в ПРОЕКТАХ

Тип Где Назначение
.php lideravto/, drupal-lab/ CS-Cart, Drupal код
.tpl lideravto/ CS-Cart шаблоны
.twig drupal-lab/ Drupal шаблоны
.less lideravto/ CS-Cart стили
.module, .install, .theme drupal-lab/ Drupal модули
venv/ pirotehnika/ Python окружение (⚠️ не должно в git)

Только в ДАННЫХ (DATASPACE)

Тип Где Назначение
.jpg (массово) images/ Изображения товаров
.xlsx (массово) inbox/ Прайс-листы
.pdf docs/ Документы
.mp4 media/ Видео

РЕКОМЕНДАЦИИ

Что ДОЛЖНО быть в git

Группа Типы Условие
Документы .md, .txt, .rst Всегда
Код .py, .js, .ts, .tsx, .php, .go, .c, .cpp Исходники (не venv, не node_modules)
Конфиги .yaml, .yml, .json, .toml, .ini, .xml Всегда
Скрипты .sh, .bat, .ps1 Всегда
Шаблоны .twig, .tpl, .j2, .html Исходники
Стили .css, .less, .scss Исходники
SQL .sql Схемы, миграции
Web .html, .svg, .woff2 Исходники, иконки, шрифты
Git .gitignore, .gitkeep Всегда
Линтеры .eslintrc, .prettierrc Всегда

Что НЕ ДОЛЖНО быть в git

Группа Типы Причина
Данные .xlsx, .xls, .csv (большие) Бинарные, в DATASPACE
Изображения .jpg, .png (большие), .webp Бинарные, в DATASPACE
Медиа .mp4, .pdf, .docx Бинарные, в DATASPACE
Архивы .zip, .tar, .gz (данные) Бэкапы в DATASPACE
Credentials .env, .key, .pem Секреты
Кеш .pyc, .log, .tmp, .cache Автогенерация
Зависимости node_modules/, venv/ Устанавливаются через npm/pip
Компиляция .so, .exe, .pak Собираются

Именование

Тип Формат Пример
Документы UPPERCASE.md README.md, CLAUDE.md, PROJECT.md
Агенты name.ai.md pim.ai.md, architect.ai.md
Credentials .credentials.md .credentials.md (скрыт в UI)
Конфиги lowercase.yaml schedule.yaml, config.yaml
Скрипты lowercase_snake.py/sh backup.sh, sessions.py
Модули lowercase_snake.py init.py, client.py

Где хранить

Тип файла Платформа Проекты DATASPACE
.md документация ✅ architect/ ✅ docs/
.py библиотеки ✅ library/
.py проектный код ✅ app/
.yaml конфиги ✅ system/config/ ✅ config/
.sh инфра-скрипты ✅ infra/scripts/
.sh проектные скрипты ✅ scripts/
.xlsx ✅ inbox/
.jpg ✅ images/
.mp4 ✅ media/
.pdf ✅ docs/

ПРОБЛЕМЫ И ЗАДАЧИ

⚠️ Критические проблемы

  1. 156 .jpg в git (pirotehnika)
    - Путь: /opt/claude-workspace/projects/org/pirotehnika/
    - Действие: Переместить в /mnt/beget-s3/projects/pirotehnika/images/
    - Обновить ссылки в коде

  2. 32 .xlsx в git (pirotehnika)
    - Путь: /opt/claude-workspace/projects/org/pirotehnika/
    - Действие: Переместить в /mnt/beget-s3/projects/pirotehnika/data/

  3. 6000+ venv файлов в git (pirotehnika)
    - Путь: /opt/claude-workspace/projects/org/pirotehnika/app/*/venv/
    - Действие: Добавить venv/ в .gitignore, удалить из git
    - Создать requirements.txt

Рекомендации по очистке

# 1. Переместить изображения
mv /opt/claude-workspace/projects/org/pirotehnika/*.jpg /mnt/beget-s3/projects/pirotehnika/images/

# 2. Переместить таблицы
mv /opt/claude-workspace/projects/org/pirotehnika/*.xlsx /mnt/beget-s3/projects/pirotehnika/data/

# 3. Удалить venv из git
cd /opt/claude-workspace/projects/org/pirotehnika
echo "venv/" >> .gitignore
git rm -r --cached app/*/venv/
git commit -m "Remove venv from git"

# 4. Создать requirements.txt
pip freeze > requirements.txt

СТАТИСТИКА

Сводная таблица

Категория Workspace DATASPACE Всего
Документы 6,292 113 6,405
Код 19,875 75 19,950
Конфиги 6,185 55 6,240
Данные 377 3,020 3,397
Изображения 395 2,214 2,609
Медиа 0 46 46
Архивы 1,463 89 1,552
Другое 3,078 466 3,544

ИТОГО: 37,665 файла (31,665 workspace + 4,078 DATASPACE)

Распределение по языкам (код)

Язык Файлов %
Python 9,231 46.3%
JavaScript 5,408 27.1%
TypeScript 1,333 6.7%
JSON 3,373 16.9%
PHP 381 1.9%
Shell 193 1.0%
C/C++ 208 1.0%

CHANGELOG

2026-02-19 — v1.0.0


Автор: Claude Opus 4.5
Версия: 1.0.0