WIN projektas
Valstybės Duomenų Agentūra kartu su 17 kitų organizacijų iš 14 Europos šalių dalyvauja „Trusted Smart Statistics – Web Intelligence Network” projekte. Projektas yra ankstesnės veiklos, vykdytos 2016–2020 m. (projektai „ESSnet Big Data” ir „ESSnet on Big Data II”) ir skirtos alternatyvių / naujų duomenų šaltinių panaudojimo galimybių oficialioje statistikoje analizavimui, tęsinys. Pagrindinis šio projekto tikslas – padėti sukurti WIN (Web Intelligence Network) tinklą, naudojamą visoje ES ir už jos ribų rengiant statistiką, įtraukiančią iš interneto nuskaitytus duomenis.
Kuriamo tinklo testavimas atliekamas analizuojant dviejų sričių duomenis: laisvų darbo vietų skelbimus internete (OJA – Online Job Advertisements) ir iš interneto nuskaitytus duomenis, naudojamus įmonių charakteristikoms vertinti (OBEC – Online-based Enterprise Characteristics). Norint įvertinti įmonės charakteristikas naudojant nuskaitytus duomenis, reikalingas įmonių interneto svetainių sąrašas.
Įmonių interneto svetainių sąrašo sudarymas ir rodiklio (įmonių turinčių interneto svetainę procentas) vertinimas
OBEC populiaciją sudaro visų rūšių ir nuosavybės formų juridiniai vienetai, kurių veikla pagal EVRK 2 red.(Ekonominės veiklos rūšių klasifikatorius) priskiriama C–J, L–N ir S sekcijoms, kuriose dirba 10 ir daugiau darbuotojų. Remiantis administraciniais ir privačiais šaltiniais daliai juridinių vienetų yra priskiriamos jų interneto svetainės. Likusiai daliai populiacijos interneto svetainių (arba požymio, jog tiriamas juridinis vienetas interneto svetainės neturi) priskyrimas vykdomas naudojant URL (angl. Uniform Resource Locator) paieškos programą. Pastaroji susideda iš kelių etapų:
potencialių juridinių vienetų interneto svetainių paieškos, įvedant raktinius žodžius į interneto paieškos platforma;
surastų potencialių juridinių vienetų interneto svetainių nuskaitymo ir reikalingų indikatorių reikšmių suradimo;
surastų potencialių juridinių vienetų interneto svetainių klasifikavimo į tinkamus (nagrinėjama interneto svetainė yra konkretaus juridinio vieneto interneto svetainė) ir netinkamus (nagrinėjama interneto svetainė nėra konkretaus juridinio vieneto interneto svetainė).
Pirmame etape raktiniais žodžiais pasirenkama: juridinio vieneto pavadinimas, kodas ir savivaldybė, kurioje juridinis vienetas registruotas. Antrame etape pasirenkami 8 rodikliai: „ar nagrinėjamoje interneto svetainėje yra konkretaus juridinio vieneto kodas“, „ar nagrinėjamoje interneto svetainėje yra konkretaus juridinio vieneto adresas“, „ar nagrinėjamoje interneto svetainėje yra konkretaus juridinio vieneto telefonas“ ir kt. Svetainių klasifikavimui naudojami ir deterministiniai, ir mašininio mokymosi metodai.
Gautas rezultatas – turimas juridinių vienetų sąrašas papildytas požymiu ar juridinis vienetas turi interneto svetainę ar ne. Nuo 2022 m. duomenys skelbiami pagal statistinį vienetą – įmonė (atskiras juridinis vienetas arba mažiausias organizacinis juridinių vienetų junginys, gaminantis prekes ar teikiantis paslaugas, turintis tam tikrą savarankiškumą priimant sprendimus, paskirstant savo esamus išteklius, vykdant vienos ar daugiau rūšių veiklą vienoje ar keliose vietose). Gautas juridinių vienetų sąrašas transformuojamas į įmonių sąrašą taikant taisyklę: jei bent vienas įmonei priklausantis juridinis vienetas turi interneto svetainę, tuomet įmonė turi interneto svetainę. Įmonių, turinčių interneto svetainę, procentas vertinamas pagal veiklos rūšį, regioną, apskritį, savivaldybę (žr. žemiau).
Kitų įmonės charakteristikų, tokių kaip „ar įmonės internetinėje svetainėje yra nuoroda į socialinius tinklus”, „ar įmonė vykdo elektroninę prekybą” ir t. t., vertinimas testuojamas ir bus skelbiamas vėliau.
Duomenys parengti: 2023 m. lapkričio mėn.
Pasiteirauti
Vilma Nekrašaitė-Liegė
El. paštas: [email protected]
Tel.: +37065040807
Rodiklių paaiškinimai:
Rodiklių paaiškinimai:
Rodiklių paaiškinimai:
Rodiklių paaiškinimai:
Rodiklių paaiškinimai:
Rodiklių paaiškinimai: