From d0ba14fdbcc1b9bdb17b16617d7ec291bea09994 Mon Sep 17 00:00:00 2001 From: Phuoc Cao Date: Sat, 2 Dec 2023 11:42:56 +0100 Subject: [PATCH] convert utc to local time, check if body tag exists in file --- html_cleanup/static/temp/errors_log | 7 +++++++ html_cleanup/views/default.py | 25 ++++++++++++++++--------- 2 files changed, 23 insertions(+), 9 deletions(-) diff --git a/html_cleanup/static/temp/errors_log b/html_cleanup/static/temp/errors_log index dc65b8c..2f71fe6 100644 --- a/html_cleanup/static/temp/errors_log +++ b/html_cleanup/static/temp/errors_log @@ -2,3 +2,10 @@ 2023-11-29 17:23:56 [ Screenshot 2023-11-20 at 12.07.54.png ] Le format du fichier n'est pas valide. Téléchargement refusé. 30-11-2023 17:29 [ Nantes_anthologie_cinema_viet.htm ] *** Cleanup réussi. *** 30-11-2023 18:32 [ www.icloud.com.html ] *** Cleanup réussi. *** +02-12-2023 10:41 [ Nantes_anthologie_cinema_viet.htm ] Le format du fichier n'est pas valide (absence de tag ou ). Téléchargement refusé. +02-12-2023 10:44 [ Nantes_anthologie_cinema_viet.htm ] *** Cleanup réussi. *** +02-12-2023 10:45 [ cleanup_html.vbs.txt ] Le format du fichier n'est pas valide (absence de tag ou ). Téléchargement refusé. +02-12-2023 10:49 [ Nantes_anthologie_cinema_viet.htm ] *** Cleanup réussi. *** +02-12-2023 11:02 [ Nantes_anthologie_cinema_viet copy.htm ] *** Cleanup réussi. *** +02-12-2023 11:10 [ Nantes_anthologie_cinema_viet copy.htm ] *** Cleanup réussi. *** +02-12-2023 11:11 [ Nantes_anthologie_cinema_viet.htm ] *** Cleanup réussi. *** diff --git a/html_cleanup/views/default.py b/html_cleanup/views/default.py index a5b051f..ebd769b 100644 --- a/html_cleanup/views/default.py +++ b/html_cleanup/views/default.py @@ -49,20 +49,27 @@ def process_file(request, input_file, input_name): # lire la taille du fichier input_file.seek(0, 2) #seek to end filesize = input_file.tell() - input_file.seek(0) # back to original position + input_file.seek(0) # back to begining position # controler la taille du fichier if filesize > MAX_SIZE: message = "La taille du fichier dépasse la limite autorisée. Téléchargement refusé." add_error2log(logfile_name, input_name, message) else: - # controle OK, traiter le fichier - output_name = "clean_" + input_name - output_file = os.path.join(temp_folder, output_name) - message = clean_html(input_file, output_file) - if message: + # recherche des tag + data = input_file.read().decode('utf-8') + if data.find('') == -1: + message = "Le format du fichier n'est pas valide (absence de tag ou ). Téléchargement refusé." add_error2log(logfile_name, input_name, message) else: - add_error2log(logfile_name, input_name, "*** Cleanup réussi. ***") + input_file.seek(0) # back to begining position + # controle OK, traiter le fichier + output_name = "clean_" + input_name + output_file = os.path.join(temp_folder, output_name) + message = clean_html(input_file, output_file) + if message: + add_error2log(logfile_name, input_name, message) + else: + add_error2log(logfile_name, input_name, "*** Cleanup réussi. ***") @@ -85,7 +92,6 @@ def clean_html(input_file, output_file): for line_in_bytes in input_file: line_in = line_in_bytes.decode('utf-8') line_out = "" - if not body: init = line_in.find("