Skip to content
This repository has been archived by the owner on Apr 20, 2021. It is now read-only.

[VZ] IC 00000000 na profilech zadavatelu #64

Open
martinnec opened this issue Apr 17, 2014 · 5 comments
Open

[VZ] IC 00000000 na profilech zadavatelu #64

martinnec opened this issue Apr 17, 2014 · 5 comments
Assignees
Labels

Comments

@martinnec
Copy link
Contributor

Obcas je na profilu zadavatele v tenderu IC 00000000 a to se ti pak slejva do jednoho resource. Nebyl by v techto pripadech lepsi GUID nebo URI z nazvu dodavtele?

@jakubklimek
Copy link
Contributor

Tak je to otazka. Tyhle data jsou tak jako tak vadny takze je otazka jestli
se tim zabyvat. Techhle specialnich ic je tam vic.
On Apr 17, 2014 12:47 PM, "Martin Nečaský" [email protected] wrote:

Obcas je na profilu zadavatele v tenderu IC 00000000 a to se ti pak slejva
do jednoho resource. Nebyl by v techto pripadech lepsi GUID nebo URI z
nazvu dodavtele?


Reply to this email directly or view it on GitHubhttps://github.com//issues/64
.

@martinnec
Copy link
Contributor Author

No, ses si jistej tou vadnosti? Lepsi nemame, takze je treba je brat jako fakt :-)

@jakubklimek
Copy link
Contributor

V ARES:


darv_or.cgi@ico=96094392364.rdf
darv_or.cgi@ico=98393835.rdf
darv_or.cgi@ico=99999987.rdf
darv_or.cgi@ico=99999990.rdf
darv_or.cgi@ico=99999996.rdf
darv_or.cgi@ico=99999998.rdf
darv_or.cgi@ico=99999999.rdf
darv_or.cgi@ico=ATU21505707.rdf
darv_or.cgi@ico=DE116084527.rdf
darv_or.cgi@ico=HE269417.rdf
darv_or.cgi@ico=HRB172107.rdf
darv_or.cgi@ico=HRB726261.rdf
darv_or.cgi@ico=IT00974240491.rdf
darv_or.cgi@ico=nep_id_leno.rdf
darv_or.cgi@ico=nep?id?leno.rdf
darv_or.cgi@ico=NEUVEDENO.rdf
darv_or.cgi@ico=xxx.rdf
darv_or.cgi@ico=ZAHRANICNI.rdf

@jindrichmynarz
Copy link

V případě Věstníku veřejných zakázek jsme nespolehlivé IČO a chybné slévání firem, které sdílí stejné (chybné) IČO a přesto jsou různé, (dočasně) vyřešili generováním UUID-based URI pro každou firmu a následně pomocí deduplikace, která brala v potaz nejenom IČO, ale taky další vlastnosti (název firmy atp.). Deduplikační pravidla pro Silk pro instance gr:BusinessEntity z Věstníku veřejných zakázek jsou tady.

@jindrichmynarz
Copy link

Kromě toho jsme si půjčili Martinovu validaci IČO a provádíme ji rovnou při XSL transformaci, která potom označí IČO neplatná dle kontrolní číslice (ty lze potom brát jinak při deduplikaci, např. pomocí string distance metriky namísto přesné shody).

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
Projects
None yet
Development

No branches or pull requests

3 participants