Tekoälyn juridiikkaa 2023: Generatiivisen tekoälyn käyttö ohjelmistokehityksessä
Generatiivisen tekoälyn käyttöönoton kärjessä ovat olleet ohjelmistokehitystä tekevät yritykset. Tämä käy ilmi myös DLA Piperin tekemästä globaalista tekoälyn käyttöönottoa koskevasta kyselystä, jonka raportin voit ladata täältä.
Kielimallit ohjelmistokehityksen automatisoinnissa
Kielimallit ovat osoittautuneet erittäin tehokkaiksi työkaluiksi ohjelmistokehityksen automatisoinnissa. Erityisesti GitHubin suosittu Copilot-palvelu on ollut edelläkävijänä tekoälyn hyödyntämisessä sovelluskehityksessä. Tämä palvelu tukee ohjelmoijia tarjoamalla valmista koodia ja avustamalla ohjelmiston kehittämisessä.
Generatiivisen tekoälyn käyttö voi merkittävästi parantaa ohjelmistokehityksen tehokkuutta, mikä on hyödyksi sekä ohjelmistokehittäjille että heidän asiakkailleen. Tekoälyn käyttöön liittyy kuitenkin monia juridisia kysymyksiä, jotka ohjelmistokehittäjien ja asiakkaiden on syytä huomioida.
Tekijänoikeuksien loukkausriskit
Yksi merkittävä huolenaihe liittyy tekijänoikeuksiin. Jos tekoäly on opetettu käyttämällä tekijänoikeudella suojattua aineistoa ja tekoälyn generoima tuotos on samankaltainen tällaisen opetusaineiston kanssa, tekoälyn generoimat tuotokset voivat loukata tekijänoikeuksia, ellei opetusaineiston oikeudenhaltijoilta ole saatu suostumusta opetusaineiston käyttöön. Tällöin sekä ohjelmistokehittäjälle että asiakkaalle voi syntyä vastuu tekijänoikeusloukkauksesta. Loukkausriskin arviointi on kuitenkin käytännössä vaikeaa, sillä kielimallien tekninen toteutus ei ole täysin läpinäkyvää.
Immateriaalioikeuksiin (IPR) liittyvää loukkausriskiä voidaan vähentää, jos tekoälyohjelmiston toimittaja voi osoittaa käyttämänsä koulutusaineiston alkuperän tai ottaa vastuun sen tuottamasta sisällöstä. Esimerkiksi Microsoft ja GitHub ottavat sopimuksellista vastuuta (indemnity) niiden tuottamaan sisältöön liittyvistä IPR-loukkauksista edellyttäen, että käyttäjä on hyödyntänyt palveluun sisältyviä teknisiä suodattimia sekä muita edellytettyjä suojatoimenpiteitä.
Asiakkaan oikeudet generoituun koodiin
On mahdollista, että tekoälyn generoimalla koodilla ei ole tekijänoikeutta, koska siltä voidaan katsoa puuttuvan omaperäisyys ja “tekijyys” tekijänoikeuden vaatimassa merkityksessä. Esimerkiksi Microsoft ja GitHub ilmoittavat ehdoissaan, etteivät pidä generoimaansa sisältöä tekijänoikeuden alaisena. Tämä voi tarkoittaa, että asiakkaalla ei ole yksinoikeutta tekoälyn generoimaan koodiin, mikä saattaa vaikuttaa tuotoksen arvoon asiakkaalle. Kuitenkin, jos tekoälyn generoima koodi on osa laajempaa ohjelmistokokonaisuutta, kokonaisuus voi nauttia tekijänoikeutta, vaikka yksittäinen elementti ei niin tekisikään.
Asiakassopimuksissa on usein ehtoja, jotka koskevat kolmannen osapuolen ohjelmiston käyttöä, mikä voi edellyttää asiakkaan hyväksyntää. Koska ei ole selvää, että tekoälyn generoima koodi luetaan sopimuksellisesti kolmannen osapuolen koodiksi, asiakassopimuksissa tultaneen jatkossa sopimaan nimenomaisesti tekoälyn tuottaman aineiston käytöstä.
Virhevastuu
GitHub tai muut tekoälyohjelmistojen toimittajat eivät yleensä ota vastuuta tekoälyllä luodun sisällön virheistä. Ohjelmistokehittäjän omat asiakkaat tuskin kuitenkaan hyväksyvät, että ohjelmistokehittäjä rajaa vastuutaan tekoälyn luomasta koodista. Ohjelmistokehittäjät voivat pyrkiä rajaamaan vastuutaan samalla tavalla kuin open source (OSS)-koodin osalta, joka toisinaan on lisensioitavissa ”as is” -ehdoin, eli sellaisena kuin se on.
Luottamuksellisuus ja tietosuoja
Jotta asiakkaan koodin luottamuksellisuus säilyy, tekoälyn generoima tuotos ei saisi sellaisenaan tallentua tekoälyohjelmiston toimittajalle. Esimerkiksi GitHub ei tallenna käyttäjän syöttämää aineistoa, mutta OpenAI:n käyttäjille avoin ChatGPT voi tallentaa käyttäjän syöttämän aineiston.
Vaikka tekoäly ei tallentaisi käyttäjän syöttämää aineistoa, on yleensä syytä välttää syöttämästä lähdeaineistona henkilötietoja sisältävää aineistoa. Yleisesti käytössä olevat tekoälyjärjestelmät ovat pilvipalveluita, joiden osalta tulee arvioitavaksi mm. tietojen sijaintia ja kansainvälistä käsittelyä koskevat tietosuojavaatimukset. Tilanne on eri, jos kielimallia käyttää omilta palvelimilta, jolloin mallin kehittäminen omalla aineistolla on eri tavalla mahdollista. Tällöin on huolehdittava mm. siitä, että henkilötietojen ilmoitetut käyttötarkoitukset kattavat uudet käyttötarkoitukset (esim. kielimallien kehittäminen) ja tarvittaessa päivitettävä tältä osin käytäntöjä ja dokumentaatiota.
Monitorointi ja valvonta
Perinteisen ohjelmistojen testauksen lisäksi kielimalleja hyödynnettäessä on keskeistä riittävän testauksen ja monitoroinnin avulla varmistaa, ettei käytettävä tekoäly tee merkittäviä virheitä ja ”hallusinoi”. Lisäksi on olennaista toisaalta selvittää, miten käyttäjät voivat tunnistaa mahdollisen virheellisen tiedon sekä varmistaa, ettei rakennettavan ohjelmiston avulla tehdä esimerkiksi virheelliseen tietoon perustuvia päätöksiä tai muita ulostuloja, jotka voisivat aiheuttaa mainehaittaa organisaatioille.
Yhteenveto
Generatiivisen tekoälyn käyttö ohjelmistokehityksessä tarjoaa lukuisia etuja, mutta se tuo myös mukanaan monia juridisia ja sopimusoikeudellisia kysymyksiä. Yritysten on tärkeää ymmärtää nämä kysymykset ja ottaa ne asianmukaisesti huomioon muun muassa sopimuksissaan, jotta tekoälyn potentiaalia voidaan hyödyntää ohjelmistokehityksessä turvallisesti ja tehokkaasti.
Lue Katariina Kosken kirjoittama Tekoälyn juridiikkaa 2023 -artikkelisarjan ensimmäinen osa "Generatiivisen tekoälyn vaikutukset liiketoimintaan ja vinkit sen vastuulliseen hyödyntämiseen" täältä.
Lue myös Juulia Olssonin Oikeudelliset sudenkuopat tekoälyn käytössä markkinoinnissa.
Ota yhteyttä, jos tarvitsette juridista tukea tekoälyn käyttöönottoon liittyviin toimenpiteisiin yrityksessänne.