V?it?suutiset

V?it?s: 14.12.2018 Uusia skaalautuvia menetelmi? datan ryhmittelyyn (H?m?l?inen)

Aika:

竟博 www.joycutlery.com 14.12.2018 12:00 — 16:00


Sijainti: Mattilanniemi, Agora Gamma
Suurten datamassojen k?sittely lis?? tarvetta tehokkaammille klusterointimenetelmille, jotka perustuvat useita suorittimia hy?dynt?v??n rinnakkaislaskentaan ja hajautetun muistin k?ytt??n. Klusteroinnissa data ryhmitell??n ryhmiin eli klustereihin, joissa ryhm?n kohteet ovat samankaltaisia. Lis?ksi tavoitteena on, ett? muodostuneet klusterit ovat selke?sti toisistaan erill??n.

Joonas H?m?l?inen kehitti v?it?skirjassaan prototyyppipohjaisen klusteroinnin skaalautuvuutta, tehokkuutta ja luotettavuutta. N?iden tavoitteiden saavuttamiseksi H?m?l?inen teki parannuksia ja modifikaatioita prototyyppipohjaisiin klusterointimenetelmiin. Yksi keskeisist? teemoista on prototyyppipohjaisen klusteroinnin alustus.

- V?it?skirjassani esit?n satunnaisprojektioihin perustuvan rinnakkaistuvan klusteroinnin alustusmenetelm?n, joka on tehokas korkeaulotteisille suurille datamassoille. Ty?ni rinnakkaistettu robusti ryhmittelymenetelm? taas mahdollistaa suurten, harvojen ja virheellisten datamassojen klusteroinnin rinnakkaislaskentaa hy?dynt?en, H?m?l?inen kertoo.

K?yt?nn?n sovellusmahdollisuudet ja -tarpeet ovat laajat

Klusterointimenetelm?t ovat monik?ytt?isi? useille eri sovelluksille. Menetelmi? on k?ytetty muun muassa ymm?rryksen lis??miseen liikenneonnettomuuksista ja opintomenestyksest? sek? kaupunkien rikollisuuden ja s?dehoidon annossuunnitelmien mallintamiseen.

Esimerkiksi s?dehoidossa ryhmitell??n aiemmat annossuunnitelmat, ja tulosten pohjalta muodostetaan laadunvarmistusty?kalu. Ty?kalun avulla voidaan havaita ep?ilytt?v?t tai virheelliset s?dehoidon annossuunnitelmat ennen hoidon toteuttamista. Kaupungeissa rikollisuutta taas voidaan ennustaa ja ennaltaehk?ist? klusterointituloksen pohjalta muodostetulla mallilla. Mallin avulla saadaan ennusteita miss?, milloin ja mink? tyyppist? rikollisuutta voi mahdollisesti tapahtua.

Prototyyppipohjaisilla ryhmittelymenetelmill? pystyt??n tehostamaan muita tiedonlouhinnan menetelmi? suurille datamassoille. Suuri datamassa voidaan esimerkiksi esitt?? pienemm?ll? m??r?ll? prototyyppivektoreita, jolloin prototyyppivektoreita voidaan k?ytt?? datana jollekin toiselle tiedonlouhinnan menetelm?lle. Prototyyppipohjaisia ryhmittelymenetelmi? voidaan soveltaa my?s muun muassa tekstidokumenttien ja kuvien ryhmittelyyn sek? n?in parantaa esimerkiksi hakukoneen toimintaa.

FM Joonas H?m?l?isen tietotekniikan v?it?skirjan "Improvements and Applications of the Elements of Prototype-Based Clustering" tarkastustilaisuus on perjantaina 14.12.2018 klo 12.00 luentosalissa Gamma (Agora, Mattilanniemi 2). Vastav?itt?j?n? on professori Pasi Fr?nti (It?-Suomen yliopisto) ja kustoksena professori Tommi K?rkk?inen (Jyv?skyl?n yliopisto). V?it?stilaisuus on suomenkielinen.

Lis?tietoja

  • Joonas H?m?l?inen, joonas.k.hamalainen@www.joycutlery.com, puh. 045 113 0257
  • Tiedottaja Kati Valpe, viestinta@www.joycutlery.com, puh. 0400 247 458

Joonas H?m?l?inen kirjoitti ylioppilaaksi Pihtiputaan lukiosta vuonna 2007. H?n aloitti fysiikan opinnot Jyv?skyl?n yliopistossa 2007 ja valmistui filosofian maisteriksi vuonna 2013. H?m?l?inen on ty?skennellyt tutkimus- ja opetusteht?viss? Jyv?skyl?n yliopistolla vuodesta 2014 l?htien. H?n aloitti jatko-opinnot vuonna 2015. V?it?ksen j?lkeen h?n jatkaa ty?skentely? Jyv?skyl?n yliopistolla Suomen Akatemian rahoittamassa poikkitieteellisess? tutkimusprojektissa (HNP-AI).

V?it?skirja on julkaistu verkkojulkaisusarjassa JYU Dissertations numerona 43, Jyv?skyl? 2018, ISSN 2489-9003, ISBN 978-951-39-7621-7. Julkaisu on luettavissa JYX-julkaisuarkistossa osoitteessa http://urn.fi/URN:ISBN:978-951-39-7621-7 (PDF).