Compare commits

...

5 Commits

8 changed files with 67 additions and 16 deletions

View File

@ -25,6 +25,17 @@ COPY ./requirements.txt /code/requirements.txt
COPY ./app /code/app
RUN python3.11 -m pip install --upgrade pip
RUN python3.11 -m pip cache purge
RUN echo Y | python3.11 -m pip install --no-cache-dir --upgrade -r /code/requirements.txt
RUN echo "=== Contents of requirements.txt ==="
RUN cat /code/requirements.txt
RUN echo "=== Python version ==="
RUN python3.11 --version
RUN echo "=== Installing dependencies ==="
RUN python3.11 -m pip install --upgrade pip
RUN echo Y | python3.11 -m pip install --no-cache-dir --upgrade -r /code/requirements.txt
RUN echo "=== Installed packages ==="
RUN python3.11 -m pip list | grep hvac
CMD ["python", "main.py"]

6
Jenkinsfile vendored
View File

@ -7,5 +7,11 @@ pipeline {
sh "docker-compose up --force-recreate --build -d parse_saby"
}
}
stage('show logs') {
steps {
sh "docker-compose logs -f"
}
}
}
}

View File

@ -12,7 +12,7 @@
# How it's works
Запуск кода осущетсвляется через main.py или test.py
Важно: в test.py не выполняется 4 и 5 шаг.
**Важно:** в test.py не выполняется 4 и 5 шаг.
## 1. Получение данных с сайта.
C перва запускается скрипт parse_saby.py
@ -32,11 +32,11 @@ result_dict_data = [{128513: ('fns', 'Уведомление о налогах
```
list_data = parse_data_in_list(result_dict_data)
```
Легкий парсиннг, для преобразование, нужное в дальнейшем.
Легкий парсиннг для преобразование, нужное в дальнейшем.
## 3. validate_data() and validation.py
## 3. Валидация данных
```
list_data_validated = validate_data(list_data)
list_data_validated = DataValid.validate_data(list_data)
```
Тут из листа по листу передаем данные в класс DataValid из модуля validation.py.
DataValid наследуется от класса BaseModul модуля pydantic.

View File

@ -2,6 +2,7 @@ import working_database
import parse_saby
from validation import DataValid
import scheduler
import write_error_to_log
print("Запуск main.py")
@ -20,6 +21,8 @@ def parse_data_in_list(dict_data: dict) -> list:
result.append([key_id, *value_data])
return result
print("Очиcтка лог файла")
write_error_to_log.clear_to_log()
print("1/5. Запуск парсинга сайта")
result_dict_data = parse_saby.process_reports_parse()

View File

@ -5,7 +5,7 @@
import requests
from bs4 import BeautifulSoup
import re
import write_error_to_log
def parse_html(url: str):
"""
@ -182,6 +182,7 @@ def process_reports_parse(url_formats = 'https://formats.saby.ru'):
print_report_data(dict_result_title, name_title)
except Exception as e:
print(f"Ошибка при обработке отчета {report_title}: {str(e)}")
error_message = f"ERROR-PARSE_SABY: {e} DATA: {report_title}"
continue
return dict_result

View File

@ -2,6 +2,7 @@ from os import environ
import hvac
import hvac.exceptions
from oracledb import Error, create_pool, init_oracle_client
import write_error_to_log
init_oracle_client()
@ -89,15 +90,25 @@ class SimpleDB:
for dict_argument_bd in list_data:
print("Отправляемые аргрументы: ", dict_argument_bd)
print("Типы данных: ", *map(type, dict_argument_bd.values()))
cursor.callproc('P_RK_GOVERNMENT_REPORTS_INSERS', [
dict_argument_bd['id'],
dict_argument_bd['organ'],
dict_argument_bd['names'],
dict_argument_bd['date_from'],
dict_argument_bd['date_to'], # Может быть None
dict_argument_bd['ver'],
])
except Error as e:
raise Error(f'Ошибка при отправке данных в БД: {e}')
try:
cursor.callproc('P_RK_GOVERNMENT_REPORTS_INSERS', [
dict_argument_bd['id'],
dict_argument_bd['organ'],
dict_argument_bd['names'],
dict_argument_bd['date_from'],
dict_argument_bd['date_to'], # Может быть None
dict_argument_bd['ver'],
])
except Error as e:
# Проверка является ли запись дублирующей
if 'ORA-00001' in str(e): continue
# В остальных случаях запись ошибки и пропуск данных.
else:
error_message = f"ERROR_DB-WRITE: {e} DATA: {dict_argument_bd}"
# Запись логов
write_error_to_log.write_to_log(error_message)
continue
except Exception as e:
error_message = f"ERROR_DB-GLOBAL: {e}"
write_error_to_log.write_to_log(error_message)
raise Error(f'Неожиданная ошибка: {e}')

View File

@ -0,0 +1,19 @@
import datetime
import os
TIMESTAMP = datetime.datetime.now().strftime("%d-%m-%Y %H:%M:%S")
LOG_FILE = "error_log.txt"
def write_to_log(error_message, log_file=LOG_FILE):
"""
Записывает ошибку в лог-файл с временной меткой
"""
with open(log_file, 'a', encoding='utf-8') as f:
f.write(f"[{TIMESTAMP}] {error_message}\n")
def clear_to_log(log_file=LOG_FILE):
"""
Очищает лог-файл и записывает новую шапку
"""
with open(log_file, 'w', encoding='utf-8') as f:
f.write(f'=== Лог ошибок создан в {TIMESTAMP} ===\n\n')

View File

@ -2,7 +2,7 @@ version: "3.8"
services:
parse_saby:
image: git.dataekb.ru/sadikov/parse_saby/parse_saby_main:latest
# image: git.dataekb.ru/sadikov/parse_saby/parse_saby_main:latest
container_name: parse_saby
build: .
volumes: