Automatic classification of text interactions from virtual knowledge collaboration
Mustonen, Essi (2022)
Pro gradu -tutkielma
Mustonen, Essi
2022
School of Business and Management, Kauppatieteet
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022100360861
https://urn.fi/URN:NBN:fi-fe2022100360861
Tiivistelmä
Digital platforms allow collaboration independent from temporal, geographical and organizational boundaries. This brings competitive advantage of reaching global expertise for solving complex issues. However, virtuality places obstacles for efficient interaction between participants, which is required for knowledge sharing and creation. Digital platforms produce digital traces that can be analyzed to study the interactions. The task of analyzing the numerous traces manually is challenging, and therefore, new analytical approaches are needed. Based on previous studies, machine learning techniques are yet to gain popularity in this research context.
This study provides text mining, more specifically, text classification approaches for classifying text interactions to interaction process analysis categories. Different algorithms, such as support vector machine, random forest and AdaBoost are explored. In addition, this study approaches the classification task directly and stagewise.
The results indicate that support vector machine performs the best in both approaches, followed by random forest and AdaBoost, respectively. In this study, the direct classification performs slightly better than the stagewise approach. The collaborative work is characterized as task-oriented, with some positive socio-emotional interactions. Providing answers is dominant, indicating knowledge sharing. Overall, the models still require development for more accurate results. Työn digitalisaatio ja digitaaliset alustat mahdollistavat yhteistyön riippumatta ajasta, paikasta ja organisaatiorajoista. Tämä tuo kilpailuetua maailmanlaajuisen asiantuntijuuden saavuttamisessa monimutkaisten ongelmien ratkaisemiseksi, mutta samalla virtuaalisuus tuottaa esteitä osallistujien tehokkaalle vuorovaikutukselle, mikä on vaatimuksena tiedon jakamiselle ja luomiselle. Alustat tuottavat digitaalisia jälkiä, joiden avulla voidaan tutkia vuorovaikutusta. Jälkien analysoiminen manuaalisesti on haastavaa, joten uusia analyysitapoja tarvitaan. Aiempien tutkimusten perusteella, koneoppimisen tekniikat eivät ole vielä saavuttaneet suosiota tässä tutkimusyhteydessä.
Tämä tutkimus tarjoaa tekstinlouhinta-lähestymistapoja, tarkemmin ottaen tekstin luokittelutapoja, tekstimuotoisten vuorovaikutusten luokitteluun interaktioprosessianalyysin mukaisesti. Erilaisten algoritmien, kuten tukivektorikoneen, satunnaismetsän ja AdaBoost:n, sopivuutta testataan. Lisäksi luokittelua lähestytään suorasti, sekä vaiheittain.
Tulokset osoittavat, että tukivektorikone suoriutuu parhaiten molemmilla lähestymistavoilla. Seuraavaksi parhaiten suoriutuu satunnaismetsä, ja huonoiten AdaBoost. Tässä tutkimuksessa suora luokittelu tuottaa hieman paremmat tulokset kuin vaiheittainen luokittelu. Yhteistyötä kuvaa tehtäväorientoituneisuus, jossa on mukana positiivista sosio-emotionaalista vuorovaikutusta. Vastausten antaminen on yleistä, mikä viittaa tiedon jakamiseen. Yleisesti ottaen, tarkempia tuloksia varten mallit tarvitsevat vielä jatkokehitystä.
This study provides text mining, more specifically, text classification approaches for classifying text interactions to interaction process analysis categories. Different algorithms, such as support vector machine, random forest and AdaBoost are explored. In addition, this study approaches the classification task directly and stagewise.
The results indicate that support vector machine performs the best in both approaches, followed by random forest and AdaBoost, respectively. In this study, the direct classification performs slightly better than the stagewise approach. The collaborative work is characterized as task-oriented, with some positive socio-emotional interactions. Providing answers is dominant, indicating knowledge sharing. Overall, the models still require development for more accurate results.
Tämä tutkimus tarjoaa tekstinlouhinta-lähestymistapoja, tarkemmin ottaen tekstin luokittelutapoja, tekstimuotoisten vuorovaikutusten luokitteluun interaktioprosessianalyysin mukaisesti. Erilaisten algoritmien, kuten tukivektorikoneen, satunnaismetsän ja AdaBoost:n, sopivuutta testataan. Lisäksi luokittelua lähestytään suorasti, sekä vaiheittain.
Tulokset osoittavat, että tukivektorikone suoriutuu parhaiten molemmilla lähestymistavoilla. Seuraavaksi parhaiten suoriutuu satunnaismetsä, ja huonoiten AdaBoost. Tässä tutkimuksessa suora luokittelu tuottaa hieman paremmat tulokset kuin vaiheittainen luokittelu. Yhteistyötä kuvaa tehtäväorientoituneisuus, jossa on mukana positiivista sosio-emotionaalista vuorovaikutusta. Vastausten antaminen on yleistä, mikä viittaa tiedon jakamiseen. Yleisesti ottaen, tarkempia tuloksia varten mallit tarvitsevat vielä jatkokehitystä.
