See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus

Uus algoritm soovitab tõeliselt atraktiivseid reisisihtkohti


28.09.2021       Kaire Uusen

Tallinna Tehnikaülikoolis doktoritööd kaitsnud Ago Luberg töötas välja algoritmi, mis soovitab netis surfavale reisihuvilisele just neid vaatamisväärsusi ja külastamist väärt kohti, mida inimene tõepoolest näha tahab. Kuidas?

Inimesed võivad väita, et nad ei järgi mingil juhul automaatsüsteemide soovitusi. Üks põhjus võib olla see, et enamik neist ei ole küllalt intelligentsed ega paku meile piisavalt infot. Doktoritöös „Kasutajatelt kogutud andmete integreerimine parametriseeritud reisisoovituste loomiseks” ongi vaatluse all „automaatse turismisoovitaja” loomise erinevad aspektid, kusjuures fookus on just visuaalselt atraktiivsetel ja huvitavatel kohtadel.

Seega on töö idee vastuolus seni laialt levinud turismi- või reisisüsteemide automaatsoovitustega, mis keskenduvad peamiselt kaubanduslikele eesmärkidele, pakkudes näiteks kõige soodsamaid hotelle, restorane ja reisipileteid jms.

Peamine rõhk töös on turismiobjektide andmete kogumisel ja töötlemisel. Töö käigus tegeldi erinevate soovitussüsteemide (Sightsplanner, Sightsmap ja Visit Estonia veebilehe süsteem) disainimise ja arendamisega ning nende jaoks andmete kogumise, töötlemise ja integratsiooniga. Töö eesmärk oli uurida viise, kuidas parandada erinevate automaatsüsteemide n-ö nõrkusi ja luua senisest täiuslikumaid süsteeme.

Väärib märkimist, et erinevad süsteemid võtavad arvesse erinevaid aspekte. Näiteks mõnes piirkonnas tehtud fotode rohkus näitab koha visuaalset atraktiivsust, vastavate kohtade Wikipedia külastuste logide arv näitab, kui hästi neid tuntakse, samas kui sisenemised sellistesse süsteemidesse nagu Foursquare/Swarm näitavad tegelikku külastuste arvu. Seega keskenduti siin erinevatele andmeallikatele nagu nt nimed, asukohad, kirjeldused, fotode pealkirjad, erinevad tüüpi meeldimised jne. Üks eriti huvipakkuv küsimus oli topeltobjektide tuvastamine andmebaasides.

Millised on tulemused?

Ühe olulise tulemusena näitas Ago Lubergi töö, kuidas saab turismiobjektidele sobivushinde arvutamisel rakendada tõenäosuslikku ja hägusloogikat, kasutades selleks ebakindlaid kategooriaid, ontoloogiaid ning tõestajapõhiseid algoritme. Aluseks võeti olemasolev turismiobjektide andmestik ning lihtsasti esitatavad kasutaja-eelistused.

Teiseks töötati masinõppemeetodite põhjal välja süsteem, mille abil saab tuvastada samu reaalseid objekte kirjeldavad kirjeid, mis on aga pärit erinevatest andmeallikatest. Näiteks tuvastati loodud algoritmiga Tallinna söögikohtade andmestiku pealt õppides Riia turismiobjektide, sh muuseumid ja kunstigaleriid jms, kattuvus täpsusega 98%. Võrdluseks – eelnevalt oli see täpsus käsitsi seadistatud parameetritega märksa väiksem ehk 85%.

Kolmandaks lõi autor algoritmi, millega tuvastatakse turismiobjektide nimi ja kategooria – aluseks võeti kasutajate sisestatud kirjeldusi objektide kohta, kusjuures saadud andmete põhjal on võimalik integreerida andmed erinevatest andmeallikatest. Näiteks: kui kasutati Panoramio piltide allkirju, suutis algoritm leida üles umbes 56% Suurbritannia ja Prantsusmaa Wikipedias esinenud turismiobjektidest. 

Seda tüüpi töö puhul osutus Lubergi sõnul keeruliseks osaks andmete vähesus. „Meil küll olid Panoramio andmed, aga tegelikult oleks tahtnud veel erinevaid allikaid saada, et neid siis omavahel kokku sobitada. Ühtlasi on kurb, et kuna Panoramio on tegevuse lõpetanud, siis pole meil ka võimalik suuresti oma tulemusi sellisel kujul enam näidata. Küll aga loodan, et tehtud tööd saab rakendada teiste pildi- ja tekstiallikate peal ning see võib taas uusi ja põnevaid tulemusi anda.“

 

*Tallinna Tehnikaülikooli 103. sünnipäeval, 17. septembril sai Ago Luberg kätte doktorikraadi, tema töö teemaks on „Kasutajatelt kogutud andmete integreerimine parametriseeritud reisisoovituste loomiseks”. Kokku promoveeriti 66 doktorit.


28.09.2021−...