На входе линк вида https://www.reformagkh.ru/myhouse?tid=2361300&sort=name&order=asc&page=1&limit=1000. Сохраняем его как файл .html прямо из браузера. Обрабатываем скриптом, на выходе получаем файл .csv, который открываем в OpenOffice.
Копируем столбец A целиком в столбец F, нажимаем Данные → Текст по столбцам
Разделитель /, из результата разбития оставляем только цифры, остальное вычищаем (Ctrl и кнопка –). Результирующий столбец переносим в начало таблицы — это идентификатор.
Выделяем столбец Е, нажимаем Ctrl+F → Детали → Только текущее выделение, найти точку и заменить на запятую.
Затем делаем копию адреса и разбивку по столбцам по разделителю запятой. Если в столбец J отбились только литеры (А или Б, например), то их лучше сразу объединить с номером дома и удалить:
Если отбились корпуса или строения (цифровые) — оставить как есть, объединив содержимое столбцов J и K формулой =J15&» «&K15. Для строений отведён отдельный столбец, для литер он не имеет смысла.
Открываем произвольную ссылку из столбца В, смотрим ПОЛНЫЙ адрес, включая федеральный округ и муниципальный район. Это понадобится нам, т.к. привязка идёт по полному адресу.
Добавляем пару столбцов перед H, затем разбиваем столбец G по разделителю пробел. На всякий случай добавляем три столбца перед J, разбиваем улицы по разделителю точке.
В ближайшем свободном столбце объединяем посёлки и улицы формулами:
для посёлков: =H2&» «&G2&»,»
для улиц: =J2&I2&».»
Добавляем столбец в начало. Сливаем в него адрес целиком:
=M2&N2&L2 — если было строение, то добавить и его.
Если присутствуют улицы типа 1-я и 2-я (а также Б. и М.), их надо довести до полного соответствия, например: пер. Вражский 2-й → 2-й Вражский пер., ул. Бронная М. → Малая Бронная ул. и т.п. Это важно, т.к. сокращает дальнейшее количество ручной работы.
Копируем отдельные столбцы поселения и улицы, вставляем перед домом кнопками Ctrl+Shift+V (как текст). Растягиваем формулу в столбце А, где сводный переформатированный адрес.
Называем столбцы по-английски строго по маске:
adress_ rgkhid_ rgkhurl_ adrgkh_ year_ sobw_ uprorg_ district_ street_ build_
Затем сдаём документ с описанием, что это за регион (ПОЛНЫЙ адрес смотрели выше). Остальное уже дело техники.
Комментарии: