Ik zit graag met mijn neus in de boeken, al zolang ik me kan herinneren. Op de basisschool mochten we elke week drie boeken meenemen naar huis. Daar maakte ik altijd gebruik van, en vaak had ik na die drie boeken nog een stukje week over 😀. Omdat de schoolbieb niet zo groot was, had ik tegen het einde van groep acht alle boeken wel gelezen; sommige zelfs dubbel. Nu ben ik benieuwd: hoe heeft mijn boekenvoorkeur zich sindsdien ontwikkeld?

Sinds ik digitaal lees is het makkelijker om mijn leesgedrag precies bij te houden. Ik heb 171 boeken gelezen sinds februari 2014 – gemiddeld 2,8 boeken per maand. Daarvan houd ik een aantal dingen bij: hoeveel bladzijden een boek heeft, hoe snel ik het uitlees, in welk jaar het uitgekomen is, de taal (Engels of Nederlands), of het verfilmd is, enzovoorts. Ik beoordeel mijn boeken met 1 tot 5 sterren, waarbij 5 de hoogste score is.

Decision tree

Maar wat maakt nou dat ik een boek goed beoordeel? Één manier om dat te onderzoeken is een decision tree, ook wel beslisboom genoemd in het Nederlands. Je kiest de gewenste uitkomst (hier de beoordeling) en meerdere kenmerken waarvan je wil bestuderen hoe ze de uitkomst beïnvloeden. Aan het begin van de boom zit alle data nog bij elkaar in één groep, daarna wordt de groep bij elke stap opgesplitst. Hierdoor ontstaan steeds kleinere, soortgelijke selecties. Alleen relevante kenmerken komen in de decision tree terecht. Aan het einde van de boom blijkt welke uitkomst verwacht kan worden op basis van de kenmerken.

Decision trees kunnen heel complex worden, met veel lagen en uitsplitsingen. Om het overzichtelijk te houden is het resultaat hier beperkt tot twee niveaus. Dit is de decision tree die laat zien hoe ik mijn gelezen boeken beoordeel:

Decision tree – Wat beïnvloedt mijn beoordeling?

Decision tree – Wat beïnvloedt mijn beoordeling?


Bladzijden en leessnelheid

De decision tree begint bovenaan met de volledige set boeken. Die beoordeel ik gemiddeld met 3,4 sterren1. De eerste splitsing wordt gemaakt op basis van het aantal bladzijden; meer of minder dan 385. Bij meer dan 385 bladzijden belandt een boek gelijk aan het einde, met een gemiddelde beoordeling van 3,9. Dikkere boeken (25% van het totaal) krijgen dus meer sterren dan gemiddeld. Een mogelijke verklaring: ik vind het heerlijk om mezelf helemaal in een boek onder te dompelen, en misschien lukt dat beter bij dikkere boeken. Van sommige personages wil je gewoon geen afscheid nemen. Soms kan een boek niet dik genoeg zijn!

Bij minder dan 385 bladzijden vormt de snelheid waarmee ik lees de volgende splitsing. Boeken waarvan ik minder dan 14 bladzijden per dag lees krijgen een gemiddelde beoordeling van 2,6. Dit geldt voor 11% van de boeken. Voor dunnere boeken maakt het dus uit hoe snel ik ze lees. Dunne boeken die ik langzaam lees beoordeel ik het laagst. Dat klinkt logisch: als ik een boek niet interessant vind, heb ik ook minder haast om het uit te lezen.

Minder dan 385 bladzijden, én ik las meer dan 14 bladzijden per dag – zo’n boek krijgt gemiddeld 3,3 sterren. Deze grote middengroep bevat 64% van de gelezen boeken. Het gemiddelde van 3,3 sterren ligt dicht bij het gemiddelde van 3,4 sterren voor alle boeken.

Dunne boeken, dikke boeken

Uit de decision tree blijkt dat het aantal bladzijden van een boek een belangrijk onderscheid is. Daarom wil ik het effect daarvan nog eens beter bekijken:


Beoordeling en aantal bladzijden – dikke boeken worden beter beoordeeld


In deze grafiek staat één bolletje symbool voor één gelezen boek. De rode streep is de mediaan; de grens die de data in twee groepen van gelijke grootte verdeelt. De meeste boeken worden beoordeeld met drie sterren. De 1-ster-categorie bevat maar drie boeken, dat maakt het minder betrouwbaar. Als we die daarom buiten beschouwing laten, zien we hetzelfde effect dat ook al uit de decision tree bleek: als de beoordeling hoger is, heeft een boek doorgaans ook meer bladzijden.

Het zou kunnen dat ik geen dikke boeken een lage beoordeling geef omdat ik zo’n boek voor het einde al weg zou leggen. Als ik een boek niet uitlees, komt het ook niet in mijn data terecht. Bovendien belandt een boek natuurlijk niet toevallig op mijn leeslijst. Als een boek me niet interessant lijkt, zal ik er niet snel aan beginnen. Daarom zijn lage beoordelingen zeldzamer dan je op basis van toeval zou verwachten. Toch kan dit maar een klein deel van de resultaten verklaren. Er zijn nog steeds maar weinig korte boeken die met 4 of 5 sterren beoordeeld worden.

In dit stuk heb ik niet gekeken naar de inhoud, genre of schrijfstijl van de boeken. Dit is ook heel interessant, maar dat bewaar ik voor een volgende keer 😊. En natuurlijk blijf ik lezen met een gemiddelde snelheid van 2,8 boek per maand, dus de data blijft gestaag binnenstromen!


Deze post is aangepast op 12 mei 2019

  1. Ik geef als beoordeling alleen hele sterren. 3,4 is geen heel getal omdat het een gemiddelde is van de beoordeling met hele sterren.↩