Февраль 2021 — Михаил Бородин – веб-разработчик и ментор

Как отсортировать огромный файл

У меня есть файл .tsv приличного размера, содержащий документы в следующем формате Этот файл имеет размер около 67 ГБ, в сжатом виде около 22 ГБ. Я хотел бы отсортировать строки файла по идентификатору (около 300 миллионов строк) в порядке возрастания. Идентификатор каждой строки уникален и варьируется от 1 до 2147483647, могут быть пробелы. Взять и загрузить файл целиком …

Как отсортировать огромный файл Читать далее »