Linkedin Url Finder

Trouver l’url d’un profil Linkedin, seulement à partir d’une entreprise et d’un poste

Et cela directement sur Gsheet !

1. Préparation du Gsheet

Commencez par créer une feuille Gsheet.

💡
Vous pouvez créer une nouvelle directement en tapant : sheet.new dans votre navigateur.

On va avoir besoin de l’add-on Import From Web, qui va nous permettre d’importer des données de n’importe quel site web, juste avec une fonction Gsheet. Pour installer un add-on, c’est super simple :

Une fois installé, pensez à activer l’add-on sur la feuille en question, en suivant la démarche :

→ Cliquer sur “Extensions” > “ImportFromWeb” > “Activate Add-on”

image

C’est fait ? Cool !

2. Un peu de “technique”

On va voir ici sur quels principes on va s’appuyer.

2.1. Une bonne requête Google

Google propose de nombreux mots-clés, pour faire des recherches très précises.

Ici on veut récupérer l’url d’un profil Linkedin, seulement à partir du nom d’une entreprise et d’un poste.

Nous allons donc utiliser la requête suivante :

🔎
site:fr.linkedin.com/in intitle:"company" AND intitle:”job_title

Pour vous expliquer rapidement : site:fr.linkedin.com/in Permet de rechercher les résultats uniquement sur le site fr.linkedin.com, dans le répertoire ‘/in’, c’est dans ce répertoire que l’on trouve les profils Linkedin. Par exemple si on regarde l’url de mon profil : https://www.linkedin.com/in/antoine-baudot/. D’ailleurs, vous m’avez ajouté à votre réseau ? 🤷‍♂️ intitle:”company” et intitle:”job_title” intitle: nous permet de rechercher dans le titre de la page, or les pages Linkedin mentionnent le poste et l’entreprise AND L’intérêt ici et de chercher les résultats respectants les 2 critères placés en intitle: J’espère que c’est plus clair pour vous !

Si on récupère l’url, on obtient : https://www.google.com/search?q=site%3Afr.linkedin.com%2Fin+intitle%3A"CEO"+AND+intitle%3A"Spendesk"

Si on décortique cette url, nous avons :

  • https://www.google.com/search?
  • le paramètre “q”, qui est en fait la requête que vous saisissez dans la barre de recherche
  • Ouais, je sais, c’est moins beau, Google remplace les espaces par des ‘+’ (%20 marche également) et le ‘:’ par ‘%3A’

Pour être plus précis, on peut ajouter d’autres paramètres, par exemple :

  • num=1 Pour limiter à un seul résultat
  • gl=fr Pour rechercher en France
  • hl=fr Pour rechercher les résultats en Fr

Et nous obtenons :

👉
https://www.google.com/search?q=site%3Afr.linkedin.com%2Fin+intitle%3A"job_title"+AND+intitle%3A"company"&num=1&hl=fr&gl=fr

Gardons en tête cette url, elle nous sera utile plus tard.

2.2. Le XPath

“XPath est un langage de requête pour localiser une portion d'un document XML.” Jean-Michel Wikipédia

Dans notre cas, le XPath, va nous permettre de requêter le html retourné par l’url Google, construite précédemment.

Il permet de retrouver un élément d’une page via sa balise, son id, sa classe ou autres..

Par exemple, pour retrouver les balises h3 d’une page web, le XPath utilisé sera : //h3.

Pour tester les XPath j’utilise l’extension chrome : XPath Helper, exemple ici avec //h3 :

image

En cherchant un peu dans le code source de la page, on trouve donc le XPath qui nous permet de récupérer le lien du premier résultat de la page : (//div[@id="search"]//a/@href)[1]

Easy.

Et ce n’est pas spécifique à Google !

3. Intégration dans le Gsheet

Nous savons désormais où trouver la donnée et comment la requêter.

Top, on est prêts à construire notre Gsheet,

L’intérêt de l’add-on ImportFromWeb, c’est sa fonction =IMPORTFROMWEB()

Cette fonction demande en paramètres :

  • une Url
  • un XPath

🤷‍♂️ Ah ben on a tout !

Mais bon, ne nous arrêtons pas en si bon chemin.

Construisons l’Url dynamiquement, ce sera plus sympa pour vos petits yeux.

À partir de cette feuille :

image

Pour générer la query :

=CONCATENER("site:fr.linkedin.com/in intitle:'";A2;"' AND intitle:'";B2;"'")

Pour générer l’url :

=CONCATENER("https://www.google.com/search?num=1&hl=fr&q=";C2)

Pour le xpath :

(//div[@id="search"]//a/@href)[1]

Et enfin, pour récupérer le profil Linkedin :

=IMPORTFROMWEB(D2;E2)

BOOOOOM 🔥🔥

image

⚠️
Il se peut que ayez une erreur du type : “PENDING_REQUEST” Dans ce cas allez dans : > Extensions > ImportFromWeb > Open Sidebar Puis dans la barre latérale : > Actions > All formulas in spreadsheet > “Shake" pending requests only Il se peut que vous ayez besoin de répéter l’opération, malheureusement la fonction IMPORTFROMWEB n’est pas sans faille.

4. Pour aller plus loin

Vous pouvez faire la même chose pour récupérer le “Linkedin Title”, juste en changeant le XPath comme ci-dessous :

image

Ou encore pour faire une recherche depuis une adresse email pro, remplacez simplement la query par l’adresse email en question :

image

5. Pour aller ENCORE plus loin

Pour enrichir le fichier obtenu, vous pouvez utiliser un outil comme phantombuster pour extraire les informations de chaque profil Linkedin automatiquement (y compris l’adresse email si disponible). Dites-moi si vous souhaitez un tutoriel pour cette partie également !

Pour me contacter :

image

Email : antoine@sales-ops.fr