Страница 78 из 100

Россия - СНИЛС, ИНН, АДРЕСА (сборка) 2018 год

Добавлено: 05 авг 2022, 12:08
Altron
Общие - Россия - Россия "СНИЛС, ИНН, ПАСПОРТА, АДРЕСА (Cronos5)" 2018v08

Тип банка: Cronos
Размер банка: 3`543`650 Kb
Общее количество записей в банке: 21`504`157
Спойлер
Имя словарного банка:
Адрес словарного банка:
Список баз:
N|Название базы|Имя|Тип|Кол-во наборов|Поле кода|Кол-во записей
1|Россия: СБОРНИК [2002-2018]|RU|3|5||21'504'157
****************************************************
База :Россия: СБОРНИК [2002-2018]
Состав полей базы
N поля| Название поля|Тип|Длина поля|Словарь|Статус|Связь с базами
1|ФИО-группа|Т|100||ИФ|
2|Дата рождения|Д|||ИФ|
4|Паспорт (10)|Т|35||МН|
5|СНИЛС-11(Т)|Т|12|||
6|ИНН (12)|Т|13|||
7|Адрес|Т|255|||
8|--->Связь по Адресу|ПО|||НК|RU8
9|*Телефон (текст)|Т|15|||
11|*Телефон (Ц)|Ц|20||МН|
12|Комментарий (иногда ФИО)|Т|255||МН|
13|СНИЛС--11(Ц)|Ц|20||ИФ|
15|Flag|Т|10|||
0|Системный номер|Ц|10|||
*******************************************
Внимание - СНИЛСЫ, ИНН, Телефоны и т.д. не всегда присутствуют
Cronos 5 Pro - выгрузка в CPY
Рекомендованный пароль
Как мог, почистил от мусора и провел идентификацию.
[External Link Removed for Guests]

Re: Базы данных Cronos

Добавлено: 05 авг 2022, 13:22
Shek
Наименование банка: РФ-Клиенты и инциденты X5 ReteilGroup Пятерочка 2020
► Показать
[External Link Removed for Guests]
пароль: личный

Re: Базы данных Cronos

Добавлено: 05 авг 2022, 16:37
Burg0mister
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]05 авг 2022, 05:14 РФ - соискатели Пятерочка 11.2021
##############################################################
Формат: Cronos 5
Размер банка: 47`529 Kb
Общее количество записей в банке: 177`812
[External Link Removed for Guests]
Спойлер
База :СОИСКАТЕЛИ ПЯТЕРОЧКА 11.2021
Состав полей базы
N поля| Название поля|Тип|Длина поля|Словарь|Статус|Связь с базами
0|Системный номер|Ц|10|||
18|Ф.И.О.|Т|255|||
1|Фамилия|Т|255|||
2|Имя|Т|255|||
3|Отчество|Т|255|||
4|город|Т|255|||
5|пол|Т|255|||
6|дата рождения|Д||||
7|гражданство|Т|255|||
8|телефон|Ц|20|||
9|предпочтение|Т|255|||
10|желаемая должность|Т|255|||
11|работает|Т|255|||
13|дата создания|Д||||
14|дата коррекции|Д||||
15|Регион|Т|255|||
16|@email|Т|255|||
17|готовность к командировкам|Т|255|||

==========================
Скрытый текст
Спасибо! Около 30 тысяч строк можно срезать, довольно много повторных и тестовых записей. Но не так печально, как у Сколково, вот где нагажено :cry:

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 01:54
memnos
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]05 авг 2022, 16:37
Спасибо! Около 30 тысяч строк можно срезать, довольно много повторных и тестовых записей. Но не так печально, как у Сколково, вот где нагажено :cry:
Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы. Вот думаю выкладывать или нет.

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 07:28
PiMar
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 01:54Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы.
Какой порядок Вы считаете порядком?
Там встретились следующие виды написания
+7(987)654-32-10
79876543210
89876543210
Это еще вполне нормальные варианты написания, которые лучше привести к единому варианту например, 79876543210.
Встретился еще вариант, в котором в конец добавлены четыре первые цифры.
798765432107987

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 08:45
Burg0mister
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 01:54 Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы. Вот думаю выкладывать или нет. А то опять обвинят в плагиате... Все-таки кто хозяин этой базы ? У кого разрешение на редактирование спрашивать ? Это, конечно, шутка).
Выкладывать однозначно нужно! Вот только у нас тут грызуны водятся, которые довольно скоро пишут жалобы хостерам и файлы пропадают. Видать те самые правообладатели, которые защитить не могут, но стирать стараются :D

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 19:38
PiMar
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 01:54Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы...
Что то многовато времени потрачено. Наверное вручную ;) . Это ж 6 полных рабочих дней.
Но проблемы с файлом имеются. Есть лишние переводы строк. Есть смещение полей. Например, 225 строк содержат лишние поля, в частности разбиение на отдельные поля фамильно-именной группы, из-за чего телефоны "уезжают".
Анализ представления телефонов с помощью выходных форм и формул длится не более 10 минут. Чуть более длится коррекция телефонов с помощью формул. Но не часы, тем более десятки.

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 20:05
memnos
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 07:28
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 01:54Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы.
Какой порядок Вы считаете порядком?
Там встретились следующие виды написания
+7(987)654-32-10
79876543210
89876543210
Это еще вполне нормальные варианты написания, которые лучше привести к единому варианту например, 79876543210.
Встретился еще вариант, в котором в конец добавлены четыре первые цифры.
798765432107987
10 млн записей - 50 часов "лопатило". Ну на 95% где исправлено. остались +1... и +2... Их надо на 7 поменять. Московские №№. Что делать с №№ тел +3..., +4... пока не решил. Они под регион не подходят по коду. Наверное удалить придется за малоинформативностью поля. Еще есть №№ где 1 цифра лишняя. Какая ХЗ. Наверное тоже на удаление.

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 20:08
memnos
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 19:38
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 01:54Приведение в порядок поля "телефон" в почте россии заняло 50 часов непрерывной работы...
Что то многовато времени потрачено. Наверное вручную ;) . Это ж 6 полных рабочих дней.
Но проблемы с файлом имеются. Есть лишние переводы строк. Есть смещение полей. Например, 225 строк содержат лишние поля, в частности разбиение на отдельные поля фамильно-именной группы, из-за чего телефоны "уезжают".
Анализ представления телефонов с помощью выходных форм и формул длится не более 10 минут. Чуть более длится коррекция телефонов с помощью формул. Но не часы, тем более десятки.
ну скобки, тире и пробелы удобно коррекцией убирать. Это понятно. А вот лишние цифры - уже время надо. Выше написал.

Re: Базы данных Cronos

Добавлено: 06 авг 2022, 20:53
btrwz
[Local Link Removed for Guests] писал(а): [Local Link Removed for Guests]06 авг 2022, 20:05 ...
по-сырому так делал:
IF LEN(PT15)=0 THEN GOTO W;
IF LEN(PT15)=10 THEN GOTO Y;
IF LEN(PT15)=11 THEN GOTO X;
IF LEN(PT15)=15 THEN GOTO A;
PT75:="не 11 не 15";
GOTO W;
...
Приветствую.
Такой скорости не должно быть. Либо Кронос работает криво, либо оператор GOTO слишком медленный (а это очень может быть!). Ну не на третьем пне делали же?
Проще избавится от оператора перехода и усложнить условный оператор, что-то вроде (к примеру):
@A=AV6 //Поле с телефоном.
@B:=""
IF (LEN(@A)=12) & (SUBSTR(@A,1,1)="+") THEN @B:=SUBSTR(@A,2,11)

IF (LEN(@A)=11) & (SUBSTR(@A,1,2)="89") THEN @B:=CONCAT("79",SUBSTR(@A,3,9))
IF (LEN(@A)=11) & (SUBSTR(@A,1,4)="8495") THEN @B:=CONCAT("7495",SUBSTR(@A,5,7))
IF (LEN(@A)=11) & (SUBSTR(@A,1,4)="8499") THEN @B:=CONCAT("7499",SUBSTR(@A,5,7))
IF (LEN(@A)=11) & (SUBSTR(@A,1,4)="8496") THEN @B:=CONCAT("7496",SUBSTR(@A,5,7))
IF (LEN(@A)=11) & (SUBSTR(@A,1,4)="8812") THEN @B:=CONCAT("7812",SUBSTR(@A,5,7))

IF (LEN(@A)=10) & (SUBSTR(@A,1,1)="9") THEN @B:=CONCAT("7",@A)
IF (LEN(@A)=10) & (SUBSTR(@A,1,3)="495") THEN @B:=CONCAT("7",@A)
IF (LEN(@A)=10) & (SUBSTR(@A,1,3)="499") THEN @B:=CONCAT("7",@A)
IF (LEN(@A)=10) & (SUBSTR(@A,1,3)="496") THEN @B:=CONCAT("7",@A)
IF (LEN(@A)=10) & (SUBSTR(@A,1,3)="812") THEN @B:=CONCAT("7",@A)

IF @B="" THEN @B:=AV6
AV6:=@B

Данный вариант на не "боевом" банке дал около 2,5-3 тыс. операций в секунду.