Domů  /  Zadávací řízení

Výpis systémových zpráv

Název NIPEZ CPV Množství Jednotka Předp. hodnota za jednotku *
Popis Přílohy Identifikace Předp. hodnota za položku *
Parametry
Automatická indexace obsahu Národního úložiště šedé literatury pomocí Polytematického strukturovaného hesláře
48160000-7
Balíky programů pro knihovny
48160000-7
Balíky programů pro knihovny
Nabídky budou platné pouze od dodavatelů, kteří se zaváží, že dodat zakázku do 14.12.2012.
Analýza
Provést analýzu PSH, určit na jakou úroveň je možné heslář využít pro automatickou indexaci záznamů. V hesláři je 44 tematických řad, v rámci řad je 6stupňová výjimečně 7stupňová hierarchie. Stanovit pořadí využití jednotlivých polí, tj. soubor s plným textem, klíčová slova, abstrakt, název dokumentu, název instituce apod. Navrhnout řešení situace, kdy jsou hesla PSH přidělena na základě klíčových slov, heslo PSH je shodné s klíčovým slovem a v záznamu se pak totéž heslo/termín vyskytuje dvakrát.
Vybrat vhodný nástroj, který dokáže pracovat s češtinou, z oblasti open source softwaru. Zvláště zajistit napojení zvoleného SW s klasifikačním modulem, který je zabudovaný v systému Invenio, používaném pro digitální repozitář NUŠL.
Software
Pro docílení co nejpřesnější indexace doporučujeme kombinaci dvou způsobů automatické indexace, tj. automatické extrakce a automatického přiřazování.
Součástí modelu bude vytvoření negativního slovníku (stop-slovníku), jehož obsahem by neměla být pouze „klasická stop slova“ jako jsou spojky, předložky, apod., ale také specifická slova typická pro některé typy dokumentu, např. „práce“ v případě indexace z abstraktu záznamů VŠKP.
Indexace
Předpokládáme, že v době plnění zakázky bude v repozitáři cca 130 tis. záznamů. Počet záznamů nelze přesně odhadnout, závisí na úspěšnosti uzavírání smluv o spolupráci s institucemi a následném harvestování a vkládání záznamů od těchto partnerských institucí.
Požadována úspěšnost přidělování hesel je více jak 60%. Výsledkem musí být méně než 5% záznamů bez přidělených hesel PSH. Pokud tato situace nastane, záznamům budou automaticky přiřazena hesla dle oblasti zájmů producenta dat, např. VŠE = ekonomie.
Intelektuální kontrola záznamů Po přidělení hesel PSH softwarem musí následovat fáze, během které budou
přidělena hesla a následně budou zkontrolována odborníkem na věcnou klasifikaci.
Úspěšnosti přidělení hesel PSH se rozumí, že každý záznam bude obsahovat alespoň jedno odpovídající heslo PSH jakékoliv úrovně, naopak záznamy nebudou obsahovat neodpovídající hesla nebo hesla z úplně jiného stromu. Stop slova se nebudou objevovat jako výsledky indexování.
Součástí dodaného řešení bude uživatelské rozhraní, které umožní jednoduchou kontrolu přidělených hesel.
Výsledkem bude:
1. Analýza, jejímž výsledkem bude dokument obsahující určení úrovně využití hesláře, klíč k využití polí při indexaci a doporučený další postup.
2. Software (indexátor) pro automatickou indexaci záznamů, který bude implementován (připojen k systému Invenio).
3. Záznamy oindexované hesly PSH v Digitálním repozitáři NUŠL, cca 130 tisíc záznamů.
4. Uživatelské rozhraní pro intelektuální kontrolu přidělených hesel.
5. Dokumentace a školení k užívání softwaru.
Kromě celkové nabídkové ceny uvést též dílčí cenu jednotlivých výsledky zakázky 1.- 5.
* open source software
* zajistit napojení zvoleného SW na klasifikační modul, který je zabudovaný
v systému Invenio
Název Operátor Hodnota Max. hodnota Jednotka
úspěšnost přidělování hesel PSH min 60 %
neoindexované záznamy < 5 %

* Předpokládané hodnoty jsou uváděny bez DPH.

Kontextová navigace