Zoekfunctie negeert trefwoorden, waarom?

Moderators: Polly, Muiz, NadjaNadja, Telpeva, Essie73, ynskek, Ladybird

Toevoegen aan eigen berichten
 
 
Anoniem

Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 27-04-15 14:44

Hallo bokkers,

Het viel me al een tijdje geleden op dat de zoekfunctie sommige woorden negeert bij een zoekopdracht. Net ook weer, ik zocht op 'paard gif' (als in een gifje met een paard) maar vervolgens wordt het woord 'gif' genegeerd en zoek ik dus op paard, met vervolgens 258931 pagina's aan resultaten. Dat was niet mijn bedoeling. :+ Mijn vraag is nu aan jullie, weet iemand misschien waarom dit zo is en kan dit uitgezet worden?

Ik ben benieuwd. :)

LadyMadonna

Berichten: 62229
Geregistreerd: 09-01-01
Woonplaats: werkendam (NB)

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 27-04-15 14:47

Paard + gif

Anoniem

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 27-04-15 14:48

Dan wordt '+ gif' alsnog genegeerd. Of is dat niet wat je bedoelt?

Shadow0

Berichten: 44543
Geregistreerd: 04-06-04
Woonplaats: Utrecht

Link naar dit bericht Geplaatst: 27-04-15 14:48

Hmm, dat zou eigenlijk eens beter uitgezocht moeten worden welke woorden er wel en niet gebruikt worden. 'Gif' wordt volgens mij vooral genegeerd omdat het ook een plaatjes-formaat is. Maar echt handig is het weer niet.

Op korte termijn kan dat niet opgelost worden, en kun je denk ik het beste via google gaan, https://www.google.nl/#q=paard+gif+site:bokt.nl
Of ipv 'gif' 'giftig' proberen?

Anoniem

Link naar dit bericht Geplaatst: 27-04-15 14:49

Shadow0 schreef:
Hmm, dat zou eigenlijk eens beter uitgezocht moeten worden welke woorden er wel en niet gebruikt worden. 'Gif' wordt volgens mij vooral genegeerd omdat het ook een plaatjes-formaat is. Maar echt handig is het weer niet.

Op korte termijn kan dat niet opgelost worden, en kun je denk ik het beste via google gaan, https://www.google.nl/#q=paard+gif+site:bokt.nl
Of ipv 'gif' 'giftig' proberen?

Nee maar ik bedoel niet gif als in giftig of bestrijdingsmiddel, maar een plaatje. :)

Sammie

Berichten: 71592
Geregistreerd: 04-06-03

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 02-05-15 09:20

.gif eens proberen? Een dergelijke extensie staat altijd achter een punt.

Bunn

Berichten: 1186
Geregistreerd: 04-10-14
Woonplaats: Noord-Brabant

Link naar dit bericht Geplaatst: 02-05-15 09:27

Zet anders eens 'filetype:gif' achter 'paard'. Dan zoekt Google enkel en alleen .gif-bestanden. Super handig, werkt ook voor pdfjes enzo. :)

Anoniem

Link naar dit bericht Geplaatst: 02-05-15 17:24

Sammie schreef:
.gif eens proberen? Een dergelijke extensie staat altijd achter een punt.

Helaas, als ik zoek op 'paard .gif' negeert hij alsnog .gif.

Anoniem

Link naar dit bericht Geplaatst: 23-05-16 20:23

Ik schop toch even dit topic weer omhoog hoor :+. Net zocht ik op de naam van een paard. De zoekfunctie laat gewoon weer woorden weg, met name de korte maar essentiële woordjes. Dit is natuurlijk niet handig als je echt iets wilt vinden, dan moet je zo ongeveer heel bokt doorspitten. Is het niet mogelijk om het weglaten van woorden optioneel te maken, zodat de gebruiker zelf aan kan vinken of die dat wil ja of nee? Ik kan me hier behoorlijk aan ergeren namelijk en gebruik hierdoor de zoekfunctie bijna niet meer omdat ik bijna zeker weet dat ik niet ga vinden wat ik zoek. Ik ben benieuwd naar een reactie :j.

Groetjes,
[naam]

BartVB
Eigenaar

Berichten: 42270
Geregistreerd: 08-01-01
Woonplaats: Arnhem

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 24-05-16 11:17

Waar je tegenaan loopt is de 'stopwoorden' lijst. Om de zoekfunctie een beetje snel (en bruikbaar) te houden is er een lijst met woorden die compleet worden genegeerd. Het is bijvoorbeeld vrij onzinnig om op 'het' of 'een' te zoeken omdat die woorden in vrijwel ieder bericht voorkomen.

'gif' staat op diezelfde lijst maar dat heeft vooral een technische reden, de smileys zijn namelijk plaatjes en die zijn opgeslagen in het GIF formaat, de bestandsnamen van de smileys eindigen dus in 'gif' waardoor dit in heel, heel erg veel berichten op Bokt voorkomt. Ik kan 'gif' wel van de stopwoordenlijst halen, maar als je dan zoekt op 'paarden gif' dan krijg je ook alle berichten waar 'paard' of 'paarden' in voorkomt samen met een willekeurige smiley. Dat is ook niet helemaal wat je wil lijkt me.

De beste oplossing zou het helemaal negeren van de smileys zijn bij het zoeken maar dat is op dit moment technisch nogal erg lastig. Een betere zoekfunctie staat wel op de wensenlijst, maar dat is nogal een complex project, gaat nog even duren dus.

Tot die tijd is, zoals Anca ook al zei, Google met een 'site:bokt.nl' waarschijnlijk je beste optie helaas...

Anoniem

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 24-05-16 11:36

Het gaat op dit moment eigenlijk niet meer om de OP, ik snap je reactie namelijk erg goed, maar meer om het bericht boven jouw reactie. Is de stopwoordenlijst erg groot? Misschien zou het fijn zijn om per gebruiker zelf aan te vinken welke wel en niet genegeerd worden, al denk ik niet dat dat haalbaar is.

BartVB
Eigenaar

Berichten: 42270
Geregistreerd: 08-01-01
Woonplaats: Arnhem

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 24-05-16 12:51

Dat is inderdaad niet haalbaar omdat de stopwoordenlijst wordt gebruikt bij het maken van de zoekindex. Dit gebeurt iedere nacht opnieuw op basis van die centrale lijst.

Als je voorbeelden hebt van woorden die problemen geven dan kan ik kijken of daar iets aan te doen is. In totaal staan er 192 woorden op de lijst, allemaal met een goede reden, maar goed mogelijk dat dit af en toe problemen oplevert met zoeken.

BartVB
Eigenaar

Berichten: 42270
Geregistreerd: 08-01-01
Woonplaats: Arnhem

Re: Zoekfunctie negeert trefwoorden, waarom?

Link naar dit bericht Geplaatst: 24-05-16 17:31

Het lijkt erop dat dit (misschien) ook is op te lossen zonder de hele zoekmachine te vervangen. De software die het zoeken regelt heeft een paar weken gelden een nieuwe versie gekregen en ik zie nu dat die versie het mogelijk maakt om b.v. de smileys uit te filteren. Dat zou de stopwoordenlijst al wat korter moeten maken.

Is nog steeds niet iets dat zomaar opgelost kan worden maar dit kan nu iig hoger op de lijst.