Betere teksten op je website dankzij natural language processing

Schrijft een computer binnenkort alle teksten voor jouw website? Wellicht niet, maar Natural Language Processing kan wel helpen om jouw copy efficiënt te verbeteren.

Het doembeeld van computers of artificiële intelligentie die onze jobs overnemen duikt regelmatig op. Zelf zien we artificiële intelligentie en machine learning liever als een nuttig hulpmiddel of een handige assistent.

Zo zal een computer (voorlopig) nog geen vlotte SEO-teksten voor je website schrijven, maar dankzij Natural Language Processing (NLP) of Text Analytics kan hij wel helpen om je copy te verbeteren.

 

blog-nlp-robot

 

Wat is Natural Language Processing of NLP?

Natural Language Processing of Text Analytics is een machine-learningtechniek waarbij software je teksten automatisch gaat analyseren

Bekende toepassingen van NLP zijn sentimentanalyse, chatbots en vertaalmachines. De techniek staat nog niet helemaal op punt, maar hij wordt wel almaar krachtiger.

 

De computer als quizkampioen

Een voorbeeld: door Wikipedia te analyseren, slaagde de IBM-robot Watson erin om menselijke quizkampioenen te verslaan in het Amerikaanse TV-programma Jeopardy!, bij ons ooit bekend als Waagstuk.

Een iets nuttiger voorbeeld vinden we in China. Daar gebruikt de e-commercegigant Alibaba.com machine-learningtechnieken om automatisch ontbrekende productbeschrijvingen aan te vullen op zijn website.

Gezien de grote sprongen die er op vlak van Natural Language Processing gemaakt worden, kunnen we er wellicht ook vanuit gaan dat Google Translate op termijn even goede of betere vertalingen zal maken dan menselijke vertalers.

shutterstock_131230655


De mogelijkheden zijn dus enorm. Zo kan je NLP ook inzetten om de teksten op je eigen website te optimaliseren en zo de marketingimpact ervan te verhogen. Daar helpen we je natuurlijk graag mee

 

Verhoog de impact van jouw teksten met NLP

Hoe ga je nu concreet aan de slag met NLP? En waar begin je, met een website die vol teksten staat? De eerste stap is om de teksten van je website te downloaden of 'scrapen', zodat ze geanalyseerd kunnen worden.

Met text analytics bekijken we dan waar er optimalisatiemogelijkheden zijn. Er zijn verschillende toepassingen, zoals:

  • spelfouten zoeken
  • je website lokaliseren naar bijvoorbeeld Vlaams of Nederlands
  • dubbele content opsporen
  • teksten begrijpbaarder en vlotter leesbaar maken

Daarnaast kan je teksten A/B-testen om zo op te sporen welke woorden extra conversies kunnen opleveren. Superinteressant! 

 

NLP in de praktijk: zo gaan we te werk


Wanneer we een website willen verbeteren met Natural Language Processing, maken we eerst een lijst van woorden per pagina op je website. Dat doen we via 'scraping', een techniek waarbij je de teksten op webpagina’s opslaat in een eigen databank.


Daarna worden de gevonden woorden opgekuist. Je zet bijvoorbeeld alles in lowercase en verwijdert leestekens. Vervolgens kan je een lijst maken met woorden die voorkomen per pagina op je website. De term frequency is dan het aantal keer dat een woord vermeld staat op een pagina.

Met TFIDF (Term Frequency Inverse Document Frequency) ga je ook de woorden tellen per pagina, maar hou je daarnaast ook rekening met het totaal aantal keer dat een woord voorkomt in jouw teksten. Zo geef je meer gewicht aan specifieke woorden.

Wanneer je dat gedaan hebt kan je via machine-learningalgoritmes de teksten dan onderling vergelijken en groeperen. 

 


Spelfouten verbeteren

Spelfouten zijn nefast voor de betrouwbaarheid van je website. Toch zijn ze vaak aanwezig op websites met lange teksten of blogs. Ook dat kan je snel opsporen met NLP.

We vergelijken de woorden die we van je website halen met woordenlijsten van de Nederlandse taal. Zo sporen we woorden op die in geen enkele database worden teruggevonden. Om dat te doen combineren we een databank van ondertitels, het taalregister en databases uit Python-libraries.

In de lijst met niet-gevonden woorden vinden we dan vaak ook enkele tikfouten. Die kan je dan meteen gaan corrigeren. Hieronder zie je een voorbeeld van woorden die we op die manier hebben opgespoord op een bedrijfsblog:


 


Leesbaarheid verhogen

Mensen lezen niet graag lange teksten op computers en mobiele schermen. Daarvoor verkiezen ze nog altijd papier. Hoe vlotter de teksten op jouw website lezen, hoe groter de kans dat bezoekers ook effectief op je website blijven.

Hou deze tips in het achterhoofd wanneer je teksten gaat schrijven voor je website:

  • Vermijd passieve zinnen. Actieve taal leest veel vlotter.
  • Vermijd lange zinnen. Korte zinnen zijn makkelijker leesbaar en scanbaar.
  • Vermijd moeilijke, lange of weinig gebruikte woorden. Woorden die een minderheid van je bezoekers begrijpen, kan je maar beter niet opnemen. Ook lange woorden zijn minder vlot leesbaar dan korte woorden. Onze hersenen verwerken korte en goed gekende woorden sneller dan langere, minder populaire woorden.
  • Vermijd het overmatig gebruik van een bepaald woord in een tekst, maar zoek synoniemen.


Met NLP kan je nu gaan controleren in hoeverre er wordt 'gezondigd' tegen die regels. Gebruik je teveel passieve zinnen? Wat zijn de langste zinnen op je website? Wat zijn de 10 moeilijkste (of minst gekende) woorden op je website?  En op welke pagina's herhaal je vaak dezelfde woorden?



Nederlands voor Vlaanderen of Nederland?

Intracto biedt al even een service aan voor Nederlandse webshops die de Belgische markt willen betreden, om hun content te 'vervlaamsen'.

In een audit van zo'n Nederlandse site komen technische en inhoudelijke opmerkingen aanbod, maar ook het taalgebruik wordt natuurlijk onder de loep genomen. Sommige woorden zijn populairder in Nederland dan in België en omgekeerd. 


Het woord “aagje” is een voorbeeld van een typisch Nederlands woord. Het woord “aalmoezenier” daarentegen is bekender in België.

Door een statistische test uit te voeren bekijken we hoe significant de kennis van dit woord verschilt tussen België en Nederland. Hoe lager de waarde uit de statistische test, hoe typischer het woord is voor België of Nederland.

 


 

Voor een beddenwinkel die zijn website wou optimaliseren voor Belgische bezoekers maakten we bijvoorbeeld deze analyse:

 

Woorden als 'ledikant' en 'dekenkist' zijn minder bekend in België. Die kunnen dus beter vervangen worden door meer 'Vlaamse' synoniemen, voor SEO-doeleinden en om te vermijden dat de webshop te Nederlands aanvoelt voor Belgische bezoekers.

 


Paginateksten met elkaar vergelijken

Dubbele content heeft een negatieve impact op je positie in de zoekresultaten. Door woorden op verschillende pagina's van je website te vergelijken, kan je een lijst maken met gelijkaardige pagina's en zo dubbele content opsporen.

Ook sterk vergelijkbare blogartikels kan je op deze manier terugvinden. Misschien heb je twee blogposts: een verouderd artikel (bijvoorbeeld met wetgeving van 2 jaar geleden) en een nieuw (met de nieuwe wetgeving). Dan kan je in het verouderde blogartikel doorverwijzen naar de nieuwe post, mochten bezoekers toch op het oude artikel terechtkomen.


Daarnaast kan je de teksten op je website ook vergelijken met die op een gelijkaardige website. Zo spoor je content-gaps op en doe je inspiratie op voor nieuwe content op je eigen website.

 


Teksten A/B-testen

Naast NLP-analyses kan je ook A/B-testing uitvoeren om teksten op je website te optimaliseren. Dan laten we een deel van de bezoekers de oorspronkelijke tekst zien en een ander deel een alternatieve tekst. We kunnen dan conversies van beide groepen met elkaar vergelijken. Bij een succesvolle testing verhoogt het aantal conversies significant.

Bijvoorbeeld: het veranderen van de tekst 'Boek online' naar 'Volgende' op een knop op een reiswebsite leverde een extra conversie van 15% op in het aantal boekingen.

 

Verbeter ook jouw website met Natural Language Processing

Met technologieën als Natural Language Processing kan je op verschillende manieren de kwaliteit van de teksten op je website verhogen. Het schrijven ervan laat je voorlopig nog best aan menselijke professionals over.

Interesse om ook jouw website onder de loep te laten nemen en jouw copy te verbeteren? Contacteer ons vrijblijvend voor meer informatie.

Contacteer ons

Meer weten? Contacteer ons!

Michael Van Den Reym
Door Michael Van Den Reym