Добрый день всем.
Возникла потребность разбить большой текстовый файл на блоки по 100 мегабайт.
Как реализовать не знаю.
Этот топик читают: Гость
Ответов: 287
Рейтинг: 5
|
|||
карма: 0 |
|
Ответов: 784
Рейтинг: 168
|
|||
Udokanec писал(а): Возникла потребность разбить большой текстовый файл на блоки по 100 мегабайт.Текстовые файлы такого размера (более 500 мб) надо ещё умудрится найти. Самый большой текстовый файл на моём компьютере – 44,3 мб. Я так понимаю, что разбивать на блоки нужно кратно строкам? т.е. не должно разделение проходить посередине какой-либо строки. Это так? Какая кодировка текстового файла? Какой символ (\n,\r,\0,\x….) окончания строк в текстовом файле? Вот пример, разбивает текстовый файл в кодировке windows-1251, символ окончания строк - \r\n На блоки по 100000 строк. Файл размером 44,3 мб разбивается на 13 частей около секунды.
|
|||
карма: 15 |
|
Ответов: 287
Рейтинг: 5
|
|||
Файл размером около гигабайта.
Да разбивать на блоки нужно кратно строкам Кодировка UTF-8 Для примера https://disk.yandex.ru/d/4RCTnKTdqkIIzg --- Добавлено в 2023-10-27 12:37:10 GuntaВ принципе твоя схема работает.Только как определить сколько строк в 100 мегабайтах. Редактировалось 1 раз(а), последний 2023-10-27 12:37:10 |
|||
карма: 0 |
|
3