You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Salut c'est vincent de WMB
Du coup t'a utilisé strip_tags au lieu de DomDocument comme je l'avais suggéré et c'est une très bonne idée (en fait j'avais en tête un crawler sémantique avec un scoring en fonction des tags qui encapsule les mots/expressions ces derniers temps, d'où l'idée du DomDoc et de l'exo :p)
Mais bref, le code de la branche noframework est ok pour moi. Le seul truc qui me dérange c'est la boucle for pour parser les mots.
de mon côté j'aurai eu tendance a utiliser preg_split qui t'évite de faire des micro manip pour parser les mots. y'a aussi explode qui peu être utile mais dans le cas d'une page web bourré de ponctuation le preg_split me parai plus approprié.
The text was updated successfully, but these errors were encountered:
D'accord, je comprends mieux pourquoi tu suggérais DomDoc.
Ça a tout de suite plus de sens si tu parlais d'éléments plutôt que de mots.
Pour ce qui est de la boucle for et de preg_split, j'ai vu que preg_split renvoyais un tableau numérique avec les valeurs.
De ce que j'ai compris j'aurais dû compte les mots dans ce cas aussi.
J'ai raté une subtilité de preg_split ?
Je pense passer sur la branche symfony demain, je repasserais sur les différentes fonctions plus tard. Entre autre il y a un caractère qui est interprété comme un mot qui me dérange.
pour ton exo c'est bien les mots qui sont important, c'est juste que l'app que j'ai en tête nécessite de scorer les mots en partie en fonction des balises (genre filer un meilleur score si les mots sont dans un h1) etc ..
sinon pour le preg_split c'est bien ça, c'est surtout de mon point de vue avantageux pour obtenir tout de suite la liste des mots.
Salut c'est vincent de WMB
Du coup t'a utilisé strip_tags au lieu de DomDocument comme je l'avais suggéré et c'est une très bonne idée (en fait j'avais en tête un crawler sémantique avec un scoring en fonction des tags qui encapsule les mots/expressions ces derniers temps, d'où l'idée du DomDoc et de l'exo :p)
Mais bref, le code de la branche noframework est ok pour moi. Le seul truc qui me dérange c'est la boucle for pour parser les mots.
de mon côté j'aurai eu tendance a utiliser preg_split qui t'évite de faire des micro manip pour parser les mots. y'a aussi explode qui peu être utile mais dans le cas d'une page web bourré de ponctuation le preg_split me parai plus approprié.
The text was updated successfully, but these errors were encountered: