PROJET AUTOBLOG


Le blog de Seboss666

Site original : Le blog de Seboss666

⇐ retour index

Quelques liens en vrac et en français, 26° édition

dimanche 15 avril 2018 à 10:30

Ne paniquez pas en voyant l’âge de certains des articles. Ce brouillon a été démarré en Janvier, et pour diverses raisons je l’ai complètement délaissé. Ce qui est marrant finalement, c’est que j’avais sélectionné plusieurs pépites concernant le pistage en ligne, les problématiques de vie privée, et le grand public découvre enfin ce qu’on répète depuis pratiquement le début de Facebook, puisque c’est lui qui cristallise tous les problèmes, alors que ce n’est que le sommet de l’iceberg de destruction de vie privée que représente la majorité des services en ligne.

Une fraude particulièrement bien réalisée

Le web est une jungle semée d’embûches, et il est facile de se laisser piéger par une saloperie de type malveillant qui cherche soit à vous soutirer des informations, soit à prendre le contrôle de votre appareil (et les deux ne sont pas exclusifs). Faites donc attention, voici un exemple des raisons pour lesquels on devrait vraiment proposer plus de cours aux personnes débutant sur le web.

Les murs ont des Google Ears

Tout le monde ne s’attarde que sur le côté cool et peu onéreux des solutions Google Home, mais personne ne pense au vrai prix de ces appareils et du pouvoir qu’ils donnent aux sociétés qui les conçoivent. Gee met en BD ces interrogations qu’il faudrait plus souvent se poser face aux appareils vendus par ces entités.

Le nouveau servage

Le monde de l’informatique grand public serait encore plus noir qu’il ne l’est déjà actuellement sans les esprits libres des premiers hackers qui surent transmettre leurs désirs de liberté et de combat contre la servitude. Et qui continuent d’exister et de se battre pour vous.

Pourquoi il faut sanctuariser le droit à l’anonymat

Usbek et Rica est un site dont les articles de réflexions sur la possibilité d’un autre monde devraient être mis devant plus d’esprits. Cette sortie à propos de l’anonymat, déjà très compliqué à obtenir sur le web, est assez révélatrice de l’urgence à garder conscience et ne jamais relâcher l’attention concernant le pouvoir qu’on les sociétés et les dérives toujours plus grandes de nos états dits démocratiques s’arrogent sur nous.

Pourquoi ne plus faire confiance à Microsoft

Microsoft a beaucoup changé ces 20 dernières années, et vient encore d’annoncer des changements dans son organisation. Parfois en bien, mais trop souvent encore en mal. Seb Sauvage nous a concocté un petit état des lieux de ce que Micorosoft propose, ou plutôt impose à ses utilisateurs.

Darknet : Freenet, ZeroNet et i2P

Vous pensez que Tor est le seul outil dont on dispose pour améliorer l’anonymat des communication ? Déjà d’une part ce n’est qu’un morceau d’un ensemble plus grand, à la fois d’outils mais aussi de réflexes d’hygiène d’utilisation, mais il ne concerne que la partie réseau, et il n’est ni le premier, ni le seul. Petite découverte de quelques autres acteurs de réseaux de protection des communications.

Optimiser les images et réduire leur poids : formats, outils et RWD

On a beau travailler à des réseaux plus rapides, aussi bien sans-fil (4G, 5G, satellite) que fixe (Fibre, VDSL), ce n’est pas une raison pour être un gros porcho à coller des images immenses sur vos sites. D’ailleurs, vous serez pénalisé pour ça si le référencement est une des préoccupations de votre espace public en ligne. Voici donc un florilège d’options et d’outils à envisager pour éviter les lourdeurs pour les clients.

Et si les bouffeurs devenaient des créateurs ?

Korben n’est pas le premier à émettre l’idée, mais sa voix porte singulièrement plus que d’autres. Quelle voix ? Le monde est majoritairement composé de consommateurs passifs, ce qui fait le bonheur des sociétés qui nous cherchent à nous exploiter sous prétexte de nous fournir un service gratuit.

Diagnostiquer une erreur de poignée de main TLS

Du bien poilu, très actuel étant donné que le TLS se répand comme une trainée de poudre, aussi bien pour le web que pour le mail, certains outils de communication, et qu’il vient même de voir une nouvelle révision publiée (1.3, dont je n’ai, honte à moi, pas encore regardé tous les tenants et aboutissants).

Aide au choix d’un framework JavaScript

A mon grand désarroi, le langage JavaScript n’est pas près de disparaitre, et il se peut même que je soit contraint de m’y intéresser à la suite de la refonte de ma collection de films DVD/Bluray. Je suis tombé sur cet article très intéressant, qui fait un peu le tour des projets actifs en listant avantages et inconvénients, ce qui pourrait vous aider à sélectionner le bon morceau dans vos propres projets.

Comprendre les enjeux de la neutralité du net

Vous avez entendu parler de la neutralité du net mais ça vous parait un peu flou ? Xhark, tenancier de BlogMotion, vous propose de quoi capter rapidement l’essentiel du problème avec texte, notamment grâce à Monsieur Bidouille.

 

Eviter les conflits de redirection dans Nginx

jeudi 12 avril 2018 à 18:30

J’aime les clients quand ils changent de site, c’est toujours un bonheur de voir les agences SEO rouler des mécaniques avec leurs tableaux Excel pour rediriger les URLs de l’ancien site vers le nouveau. Le problème, c’est qu’ils n’ont absolument aucune considération pour les personnes qui vont être chargées de traduire ces horreurs en règles de redirection pour le serveur web. Voici donc un petit retour d’expérience sur un sujet qui aura été douloureux, encore plus quand on voit la solution.

Contexte : le client a changé de domaine et de moteur de site, et veut qu’on redirige plusieurs milliers d’URLs vers les « bonnes » pages, afin de récupérer rapidement la visibilité de son ancien domaine pour le nouveau, les moteurs de recherche opérant alors des substitutions au niveau de leur base de liens.

Il utilise Nginx en tant que serveur web, la procédure n’est pas compliquée (je vous passe la conversion « Excel->rewrites », c’est infernal, un peu sauvé par Notepad++ quand même), je met ses règles dans un fichier dédié, je colle un include dans son bloc server{} sur l’ancien site, et roulez jeunesse. Enfin presque, il aura fallu quelques corrections, avec une connerie que représente le tableau de plus de 28000 lignes qu’on m’a transmis, avec une quantité d’URLs qui n’existent tout simplement pas, ça aura cramé du temps, beaucoup.

D’ailleurs, et c’est le cœur du problème, je dois faire des redirections particulières au niveau d’URI identiques mais avec des Query strings différentes, autrement appelés « Query parameters » dans Nginx. Pour rappel, voici un petit schéma sur la décomposition d’une URL :

C’est un des rares points sur lesquels je préfère Apache sur le sujet, le module Rewrite permet de les traiter de la même manière les URI, les hosts, les protocoles, les query_strings… Bref, pour ça pas de miracle, il a fallu passer par des blocs location{} :

server {

  listen 80;
  server_name ancien-domaine.com ancien-domaine.fr www.ancien-domaine.fr;
  server_name www.ancien-domaine.com;

  ##Redirections suite changement domaine pour nouveau-domaine.com


  location ~ ^/403.html {
    if ($arg_page ~ "\/query-parameters\/a-la-con.html") {
      rewrite ^.*$ https://www.ancien-domaine.com/query-parameters/nouvelle-adresse.html? permanent;
    }

    if ($arg_page ~ "\/query-parameters\/un-peu-moins-con.html") {
      rewrite ^.*$ https://www.ancien-domaine.com/query-parameters/nouvelle-adresse-moins-bete.html? permanent;
    }

    if ($arg_page ~ "\/query-parameters\/pertinent.html") {
      rewrite ^.*$ https://www.ancien-domaine.com/query-parameters/nouvelle-adresse-intelligente.html? permanent;
    }

  }

  location ~ ^/404.html {
    if ($arg_page ~ "\/query-parameters\/a-la-con.html") {
      rewrite ^.*$ https://www.ancien-domaine.com/query-parameters/nouvelle-adresse-debile.html? permanent;
    }

  }

  include sites/ancien-domaine.com/ancien-domaine_rewrites_new.conf;

}

On voit bien la difficulté, la page de base est la même ou presque dans tous les cas (403.html ou 404.html), mais on lui applique des paramètres, ici appelé page, qui servent notamment à garder la trace de l’erreur, et potentiellement proposer des pages pertinentes à partir des termes de celle qui était recherchée. Dans Nginx, on a une syntaxe $arg_<parametre> qui permet d’analyser son contenu, voir d’autres s’il y en a plus d’un. $args contient l’intégralité des paramètres.

Pourtant ça ne fonctionnait pas, le fichier de réécriture et surtout sa dernière règle qui redirige vers la page d’accueil passait toujours avant, même en étant déclarée après dans le vhost. Il aura fallu pas mal d’essais, de tentatives de syntaxes à base de mappings, j’ai du tenter 4 écritures différentes que je n’ai malheureusement pas conservé pour les partager, sans succès.

L’explication semble être que même déclarées sur le tard, des directives rewrite sont toujours interprétées en premier par Nginx, avant les directives location, qui elles pour le coup sont exécutées dans l’ordre de définition. La solution était finalement affreusement simple, encapsuler l’include dans un location générique en fin de vhost :

location / {
include sites/ancien-domaine.com/ancien-domaine_rewrites_new.conf;
}

Je vous cache pas qu’un peu de frustration et quelques jurons ont fleuri pendant cette mise en place. D’autant plus vu la simplicité de la solution. Une justification suffisante à mes yeux pour vous éviter la même galère en vous partageant cette astuce autrement que dans un petit paragraphe d’un « astuces diverses » 🙂

Horreur : je ne sais plus vulgariser

lundi 9 avril 2018 à 18:30

Enfin, savoir n’est peut être pas le meilleur verbe. Mais c’est un fait, si vous cliquez sur la catégorie vulgarisation, le rythme de ces billets a grandement baissé, et vous n’imaginez pas pendant combien de temps le dernier est resté à l’état de brouillon. Et je n’arrive plus à écrire ou finaliser de nouveaux articles, ce qui est un problème étant donné qu’on a plus que jamais besoin d’expliquer, de démystifier pour une masse toujours plus éloignée des technologies pourtant dans leur main au quotidien. Mais que se passe-t-il?

Il faut remonter aux origines du blog pour comprendre déjà la motivation première derrière la vulgarisation. À l’époque je n’étais pas encore un « professionnel » de l’hébergement, et je baigne dans un environnement rural globalement très ouvrier dont le quotidien se résume à compter chaque centime pour manger ou payer son loyer. Tout ça dans un secteur industriel vieillissant déjà souffrant avant la crise de 2008 qui a laissé pas mal de monde sur le carreau. Donc les « nouvelles technologies » , le Web, le cloud, l’IA, tout ça les dépasse, ne les intéresse pas, leur seule utilisation du Web est la consultation de leur fil Facebook et de sa bulle, le concept même de navigateur Web est mal compris (Chrome fait des ravages)… Et moi au milieu mordu par une araignée informatique quand j’étais petit, toujours accro à cet univers et qui démonte des ordis depuis des années et lit les infos quotidiennement dans plusieurs langues et sur plusieurs sites (quand la source de nouvelles des autres se résume à tf1 et le courrier picard), je suis en profond décalage.

Et donc dès que je veux partager quelque chose d’important ou que je trouve excitant, je dois trouver des images, expliquer longuement le contexte avant même d’aborder le sujet premier. C’était un exercice quotidien ou presque à l’époque, j’avais donc la tête pleine d’idées, d’analogies plus ou moins précises sur pas mal de domaines, j’arrivais même à m’adapter à la spécialité de mon interlocuteur pour choisir une imagerie adaptée à ses connaissances.

À l’ouverture du blog il était donc tout naturel de coucher certaines de ces idées, surtout les plus utilisées, sur le papier numérique. Les sujets ont été nombreux, pas toujours dans le bon ordre il est vrai, et certains ont malgré tout subi de nombreuses réécritures avant d’être publié. J’avais même sous la main ma chère maman que je mettais régulièrement à contribution pour relecture afin de m’assurer d’être d’une certaine clarté. Et pourtant sur plusieurs sujets elle n’était pas forcément le meilleur cobaye, quand on sait que dans mes jeunes années elle codait en assembleur sur l’Amstrad CPC

Et puis ma vie à changé pratiquement du tout au tout, grâce à Flemzord et une entreprise, LinkByNet, qui accepte le pari qu’un autodidacte peut faire aussi bien qu’un diplômé avec la même expérience professionnelle. Je déménage, habite quelques temps chez ma marraine avec mon oncle assez porté sur les nouvelles technologies aussi avec qui il est facile de discuter (bon ma mère est aussi une partenaire de débat de qualité sur ces sujets), et surtout, je suis plongé au quotidien dans la réalité de l’hébergement, du « cloud computing », je fais un mini-avc quand j’entends parler le service marketing de transformation digitale (je ne pensais pas être entré dans une entreprise de poterie ou de proctologues…), et proximité d’une grande région aidant, je rencontre enfin certaines personnes que je connaissais numériquement de près ou de loin, ayant souvent les mêmes sensibilités que moi, voire même plus marquées car entretenues d’échanges avec d’autres. En clair, le profil de personne que je ne trouvais absolument pas dans la Somme, une réalité de terrain bien différente.

Ce qui veut dire beaucoup moins d’entraînement, car je n’ai plus besoin d’expliquer ce qui est, à mon niveau, la base en matière de technique ou d’éthique, je peux aller directement à l’essentiel, les discussions sont donc plus variées car il n’y a plus besoin de faire de surplace. Et comme toute spécialité, si on ne pratique plus, on finit par oublier. C’est la difficulté que je rencontre actuellement. Non, ce n’est pas comme le vélo. J’avais démarré une série d’articles sur le stockage, le dernier brouillon sur le partitionnement n’a pas été retouché depuis décembre 2016. Je n’arrive pas à le structurer, à trouver le niveau de vocabulaire qui convient… C’est devenu tellement évident pour moi que ça devient compliqué de décrire clairement. Un peu comme quand on est habitué à une langue étrangère, et qu’on comprend mais l’on est incapable de traduire ce que l’on vient d’entendre ou de lire.

Et pourtant une des raisons qui font que je vais au premier samedi du libre, c’est également pour garder ce contact avec des personnes qui sont en souffrance face à leur outil. Certains sont impossibles à sauver car ils cherchent avant tout quelqu’un pour les assister en permanence (allez lire à propos des collègues de Cyrille Borne), sans vouloir retenir les bases; que j’aimerai qu’on passe un permis informatique comme pour les véhicules, au moins si on les oblige les gens retiennent le minimum. Mais pour les autres, ceux qui veulent faire un effort, il faut un guide, il faut un vocabulaire adapté, il faut des références auxquelles se raccrocher.

Je n’abandonne donc pas, mais je vais devoir être vigilant et peut-être revoir mes priorités en matière d’écriture ou d’expérimentation, à l’image du sport que je vais reprendre, peut-être vais-je devoir m’imposer des séances de vulgarisation. Je n’ai pas de réponse certaine à ce sujet. Et ça paraît con mais je flippe un peu 🙁

Est-ce que ça vous dirait de bosser avec moi chez LinkByNet ?

mardi 3 avril 2018 à 12:00

Il n’est pas encore parti que j’en suis déjà triste. Notre trolleur en chef et expert regex Simon nous quitte bientôt, désireux de tenter de nouvelles aventures après plus de six sept ans passés chez LinkByNet, d’abord à la supervision, puis à l’exploitation (en passant je vais probablement lui piquer une doc sur une installation RTMP qu’il vient de terminer récemment pour un client, histoire de partager ça ici). Moralité, étant donné le contexte dans lequel à la fois LinkByNet et notre équipe se trouvent, à savoir une forte croissance, on ne tiendra pas longtemps sans un remplaçant. L’annonce officielle n’est pas encore publiée par les ressources humaines parce que c’est tout frais, mais mon manager m’a déjà autorisé à « prospecter » avec mes propres termes. Une fois n’est pas coutume faisons donc un peu mon Genma et voyons ce que j’ai à vous proposer.

Grosse précision avant de lire : je ne l’évoque à aucun moment, et contrairement à ce que le vocabulaire le laisse penser, homme ou femme pas de restriction, au contraire même je dirais, on manque de cerveaux féminin dans l’équipe, Anh se sent seule 🙂

UPDATE du 27/04 : Je suis en retard, mais c’est fait, le candidat a été sélectionné, ce billet a donc eu son utilité 🙂 Ceci dit, LBN recrute toujours plusieurs administrateurs dans les autres équipes, donc si vous êtes en recherche et intéressé, je laisse la boite mail active pour l’instant, et je ferai passer vos CVs 😉 (j’avais d’ailleurs proposé l’un de ceux que j’ai reçu pour une équipe qui manipule souvent de l’Oracle)

Vous ferez du Linux, mais vous n’irez pas en datacenter

Donc, quel est ce poste qui se libère ? Le même que le mien, à savoir celui d’un administrateur système et applicatifs Linux (sur ma carte de visite c’est marqué Unix, mais dans l’équipe EasyRun on s’est débarrassé du dernier SunOS 5.2 qui traînait). Majoritairement sur du CentOS, mais que ça ne vous fasse pas peur, j’ai moi aussi découvert CentOS en arrivant chez LBN, on prend vite le coup (même si Yum/rpm est encore un peu obscur parfois), c’est du Linux, avec un Bash, on utilise les mêmes serveurs Web et BDD que sous Debian, bref, pas de quoi perdre la moitié de vos cheveux en arrivant dessus. Et puis on a quelques résistants sous Debian voire Ubuntu, si vraiment vous avez besoin de vous sentir à l’aise les premiers jours.

On travaille majoritairement en environnement virtualisé, à la fois sur notre « cloud » maison, baptisé @gile (construit sur VMware, mais aussi tout récemment OpenStack sur lequel je dois encore mettre mes gros doigts), que sur les plateformes Clouds AWS, Azure, et plusieurs solutions OVH (Private Cloud, serveurs dédiés…); y’a aussi Numergy, mais on espère s’en débarrasser à plus ou moins court terme. Dans un futur proche, nos architectes devraient terminer la validation de Google Cloud Platform, et si l’on en exploite pas directement chez EasyRun, on est également présent en Russie, Chine, pour les législations imposant à nos clients de disposer d’infrastructures locales (rêvez pas, c’est la seule raison pour laquelle Microsoft et Amazon s’implantent en France, sinon ils n’en auraient rien eu à foutre). Pour la partie physique, on a une équipe dédiée infra au taquet, donc sauf si ça vous intéresse vraiment à fond, vous n’aurez pas vraiment à vous concentrer dessus 🙂

Un panel de clients particulièrement diversifié, comme leurs plateformes

Le profil et le niveau technique des clients sont très variés, ça va de la fondation, à la boutique en ligne, en passant par l’associatif, l’affichage dynamique, le paiement mobile par SMS, la simple vitrine de société, des services publics, domaine pharmaceutique, finance, immobilier, et j’en passe. Des clients principalement français, mais pas exclusivement, des agences de développement sur toute la planète (Inde, Russie, Tunisie, Madagascar, Ile Maurice, Luxembourg, pour ceux qui me viennent en tête). Parmi quelques références, Microdon, Comité régional du Tourisme Ile de France, La compagnie du Lit, Le Centre Pompidou, Fondation de France, Amnesty International France, Pernod Ricard, Cogedim, Prévention routière, mesbagages.com, SodaStream, Société des Bains de Mer, EuropaCorp, Thomas Cook… La particularité de notre équipe est d’être plus proche, les administrateurs sont souvent directement en contact avec les clients ou leurs agences, avoir un bon contact est donc primordial. Comme le niveau technique est très varié, savoir adapter son niveau de langage est un atout supplémentaire. Certains clients sont presque plus « geeks » que nous, d’autres à l’inverse sont à des années-lumière, ce qui ne les rends pas incompétents sur leur propre métier soit-dit en passant (me demandez pas de pondre un contrat d’assurance). Faites un petit exercice : essayez d’expliquer avec le minimum de termes « barbares » pourquoi un certificat « wildcard » *.toto.fr ne peut pas couvrir externe.projet.toto.fr. Maintenant présentez votre explication à votre maman (sauf si elle est déjà experte dans le domaine évidemment). Elle a compris quelque chose ? Gagné ! (en vrai c’est super relou, si vous n’arrivez pas du premier coup ne fuyez pas, c’est l’exemple piège mais qui m’est déjà tombé dessus deux/trois fois).

Toutes volumétries de trafic également, certains clients font moins de visites que moi (et pourtant je suis tout petit), on croise différents moteurs de sites web, différentes technos, majoritairement du PHP/MySQL mais pas que (vous n’échapperez pas à un peu de Java/Tomcat)… WordPress, Prestashop, Drupal, Magento, et j’en passe; on va du simple site sur plateforme mutualisée Plesk à la dizaine de serveurs voire un peu plus en fonction de la criticité ou complexité de l’applicatif client. Et parce que personne n’est parfait très occasionnellement on a un peu de Windows à faire, pour lesquels on peut avoir des sujets communs (HTTPS, réseau, règles de redirections…), donc un peu de RDP à prévoir. Il va sans dire que Linux oblige, le scripting à minima shell est un prérequis, Python et Perl sont chaudement recommandés, surtout Python, Perl c’est pour savoir lire les outils historiques maison. Pas une expertise, mais une connaissance suffisante pour ne pas avoir peur devant un script à analyser voire débugger –on a des brutasses, mais eux aussi peuvent parfois faire des erreurs–, ou choisir le plus adapté pour remplir une tâche qu’on vous demande d’accomplir, et surtout automatiser.

Moultes missions vous attendent

Chez EasyRun, on a la particularité d’effectuer à la fois les intégrations et l’exploitation des plateformes de nos clients, qu’ils soient existants ou nouveaux. Il nous arrive aussi d’intervenir sur le maintien en condition opérationnelle, quand l’équipe dédiée rencontre des difficultés, par exemple pour cerner un problème sur une plateforme mal documentée (on s’améliore avec le temps, sisi :D), ou tout simplement quand ils sont débordés comme ça peut être le cas lors de pannes majeures (coucou OVH 😡 ). Évidemment nous ne sommes pas experts dans tous les domaines, et il existe des équipes réseaux, sauvegardes, monitoring, sécurité, performance pour vous soutenir ou vous guider sur tout un tas de sujets que vous ne maîtrisez pas nécessairement (je reste peu doué en réseau même si j’ai appris énormément depuis mon arrivée).

Ça c’est pour le présent, l’immédiat. Le futur est plutôt excitant, avec du Docker (déjà en cours pour des nouveaux clients, mais aussi des clients existants), de l’Ansible, pour résumer, de l’automatisation à fond, car c’est un des points clés de notre capacité à tenir la croissance que l’on rencontre déjà actuellement (en 2017 un client qui n’avait que deux serveurs chez nous est passé à plus de 10 pour différents projets, à la fois sur Azure, Amazon, OVH, et rien que cette semaine il nous demande deux nouvelles plateformes). Il y a une réflexion profonde sur la refonte de nos outils de monitoring pour lesquels nous seront forcément mis à contribution afin d’expérimenter, valider, adapter… Plus globalement l’entreprise veut évoluer vers un mode « devops » (le buzzword est lâché), mais je vous cache pas qu’avec un parc de plateformes très « ancienne mode », il faut savoir faire beaucoup plus qu’écrire une définition dans un fichier YAML qu’un binaire en go va lire et marabouter sur un datacenter à l’autre bout du monde sans que l’on sache ce qui se passe réellement sous le capot. Malgré tout, pour des purs sysadmins, cette évolution est je pense nécessaire pour mieux comprendre les méthodes employées par les développeurs et mieux les accompagner, ce qui au final profite à tout le monde.

Si vous vous joignez à moi donc, on a au moins tout ça à faire, sans parler d’innover, encore un autre buzzword, mais qui consiste avant tout à tenter de bousculer nos méthodes de travail, pour gagner en efficacité. Le terme le plus exact, l’amélioration continue, détecter ce qui ne va pas à la fois dans nos process, ceux de nos clients, pour mieux délivrer le service qu’on nous demande, et nous amuser toujours plus aussi parce que si c’était chiant, y’a longtemps que j’aurais décampé 😀 Il y a également un rôle que j’étais censé animer mais que je suis malheureusement trop peu, celui de la mise en place d’outils plus en phase avec le profils de nos clients, sur du test de montée en charge, du transfert sécurisé d’informations comme des identifiants de connexion plateforme, de la centralisation de logs, et tout autre idée qu’on pourrait avoir qui sont déjà présentes au catalogue LBN mais qui ne sont pas nécessairement abordables.

Un cadre à part, l’ambiance vraiment cool

J’arrive toujours pas à vous convaincre ? Parlons d’autre chose que de technique. Je ne peux pas parler salaire non pas parce que je n’ai pas le droit, mais tout simplement parce que je n’ai pas de chiffre à lâcher, et qu’il est modulable en fonction du profil (convention Syntec oblige). Le niveau de diplôme n’est pas une priorité, la preuve, j’en ai pas à part un BAC S et un BEP Logistique — oui, rien à voir avec l’informatique–, mais on souhaite quelqu’un qui a au minimum un an d’expérience, parce qu’avec le boulot qu’on abat actuellement, on n’aura pas le temps de valider les bases, et quelqu’un qui a déjà goûté à des process d’entreprises de manière générale sera plus à l’aise rapidement. L’expérience Jean-Félix a été très gratifiante et je suis content qu’il s’épanouisse sur le cluster e-commerce, mais nous n’aurons pas le temps de réitérer ce succès. Ah aussi, il faut être à l’aise avec l’anglais, avec la montée en puissance de l’équipe vietnamienne et du marché sud-asiatique, et des perspectives en Amérique du nord, on a besoin d’une langue commune et à l’image de l’informatique de manière générale, la langue de Shakespeare fait encore autorité, et tant pis pour les grabataires de la Commission de Terminologie et de Néologie. Pour partager un peu plus de mon expérience et du ressenti, vous pouvez tout proposer, même si tout n’est pas retenu vous serez forcément écouté, il y a une vraie bienveillance entre collaborateurs, vous pouvez discuter d’à peu près tout avec tout le monde, même les patrons, quand ils sont là évidemment parce qu’avec la dynamique qu’on a ces dernières années, ils ne se reposent pas souvent 🙂

Le poste est à pourvoir à Saint-Denis (je sais ça parait pas sexy si vous ne suivez que les infos de TF1, mais honnêtement ça va), dans un bâtiment qui abrite un toboggan–on bosse au bon étage pour l’utiliser 😛 –, un billard, une PS4, un babyfoot, un piano, une salle de sport avec quelques équipements que je vais bientôt mettre à contribution, plusieurs salles de repos à tous les étages. Dans ses valeurs LinkByNet n’oublie pas le bien-être de ses membres : régulièrement divers services son proposés sur site tels que massage, coiffure, nettoyage de voiture… L’entreprise est également impliquée dans le milieu associatif via la fondation LinkTogether, à laquelle vous pouvez évidemment participer si vous êtes sensibles aux sujets environnementaux et/ou éducatifs. Vous aurez droit, à la fin de la période d’essai, de faire du télétravail occasionnellement, très pratique pour les mois qui viennent quand les transports en commun sont paralysés par exemple, ou que vous avez besoin de faire changer votre ballon d’eau chaude –expérience inside 😀

Je pense avoir dit l’essentiel (encore que c’est beaucoup 🙂 ), si vous vous retrouvez en grande partie et que ça vous intéresse, pour me transmettre vos CVs, j’ai créé un alias mail dédié (j’en ai chié, parce que pas de wiki sur notre serveur mail, merci Aro :D) :

lbnjobs chez jobs . seboss666 . info

A vos clients mails !

PS : Si vous passez par le site web et postulez sur l’annonce qui a depuis été publiée après le début de l’écriture de ce billet, n’hésitez pas à dire que vous avez entendu parler du poste grâce à moi (de toute façon en entretien on vous posera la question) 😉

Faire du mail en 2018, c’est une tannée…

lundi 5 mars 2018 à 18:30

Genma m’a lancé un « appât » sur Twitter récemment, sur un petit retour d’expérience d’un point de vue professionnel « sur les mails ». Sujet plutôt large en fonction qu’on doive en envoyer ou en recevoir. J’avais déjà pu évoquer que ce n’était pas évident notamment avec des acteurs privés majoritaires faisant leur loi au mépris des standards et de l’universalité, spoiler alert, c’est de pire en pire.

J’ai cherché le meilleur moyen de découper cet état des lieux, on va le faire en deux grands chapitres, l’envoi d’abord, la réception ensuite, car les deux aspects ne sont pas strictement identiques en termes de problématiques à gérer. Par contre, à me relire, prenez un seau de popcorn, ça va être un peu long.

L’envoi, le cas que je traite le plus

En tant qu’hébergeur et infogérant de plate-forme Web, naturellement je vois plus de mails sortants qu’entrants, d’autant plus qu’on a décidé d’arrêter le service de boite mail qu’on proposait en fin d’année 2017. Il est donc tout naturel que je vous parle d’abord de l’envoi.

La théorie qu’on trouve dans les tutos

Quand un serveur doit envoyer un mail, il doit indiquer une adresse mail d’expéditeur, un site Web va typiquement choisir une boîte sur son domaine. La première étape consiste donc à utiliser du SPF, c’est à dire une directive au niveau DNS comportant la liste des entités autorisées à émettre des mails « depuis » le domaine en question.

La deuxième étape consiste à ajouter une signature cryptographique, le DKIM, au minimum à l’enveloppe. Ce système là aussi repose sur le DNS, qui contiendra la clé publique de la signature, le mail étant de son côté signé avec la clé privée. À la réception la signature est comparée à la clé présente dans le domaine et si ça match, c’est que le mail provient à priori d’une source fiable.

Mais apparemment ça ne suffit pas car les opérateurs majeurs poussent à l’adoption supplémentaire du DMARC, qui repose là aussi sur un champ DNS et permet de définir une politique d’acceptation ou de refus en fonction des résultats SPF et DKIM, et d’indiquer une adresse où envoyer un rapport de ce qui a été accepté ou refusé.

Quand on arrive à la pratique…

En pratique, ne jamais lancer un service sans avoir fait un minimum de vérifications avec des services comme mxtoolbox, mail-tester, isnotspam. Vous risquez alors de découvrir tout ce qu’on ne vous dit pas dans les tutos. A commencer par la réputation de l’adresse IPv4 émettrice (ou plusieurs si vous n’utilisez pas de relai). En effet, de par son aspect majeur, la pratique de l’envoi massif de spam a été pratiqué sur pratiquement toutes les plages d’adresses de la planète. Avec les redécoupages multiples des blocs d’adresses afin de tenter de retarder un peu plus l’inévitable pénurie (vu que personne ne se bouge pour l’IPv6 — oui je sais, moi c’est pas que je veux pas c’est que ça marche quand ça veut bien), il est fréquent, sur une plateforme toute neuve, de se voir attribué une adresse au passé malheureusement trouble, et c’est à vous de faire le nécessaire pour prouver que vous n’êtes pas le responsable du « casier judiciaire » auprès de toutes les listes noires chez qui vous êtes référencé.

Les outils que j’ai mentionné permettent également de comprendre si le contenu de votre mail est litigieux (plusieurs liens, html only, toussa). Ah oui, vous vous offusquez quand on vous dit que Google lit vos mails pour y ajouter de la pub ? Ça fait longtemps qu’ils sont inspectés pour savoir s’ils sont propres, et là, les critères sont complètement arbitraires, même si parfois les infos peuvent se trouver dans les enveloppes, les entêtes du filtrage antispam étant possiblement explicites ou à tout le moins documentés. Parfois, on saura même si une bêtise dans la configuration de votre agent de transport (Postfix, Exim) s’est glissée dans l’enveloppe (reverse DNS pas bon, hostname pas identifiable, ça nous est arrivé plus d’une fois). D’ailleurs si y’a un problème de reverse dans l’enveloppe, Microsoft va vous bouncer et le mail part donc direct à la poubelle (contrairement à Deferred où y’a une chance de rectifier le tire et renvoyer, puisqu’il reste en file côté expéditeur, contrairement au bounce). Joie dans la demeure, parce qu’alors on a que le message d’erreur envoyé par Microsoft sans pouvoir analyser le mail litigieux qui est déjà détruit. Quand je vous disais que c’était des connards…

Vous pensiez que le tableau était déjà noir ? C’est parti pour l’enfer de la gestion « propriétaire » des mails. On va commencer par les outils d’antispam reposant sur leurs propres règles, ceux proposés par des éditeurs de solutions classiques de sécurité (F-Secure, McAfee, Bitdefender et consorts), qui peuvent décider que le mail ne leur plaît pas sur des critères arbitraires. Et s’adresser à eux pour faire lever ce délit de sale gueule sera une vraie chienlit : support à l’étranger, réponse pas systématique… Bon courage avec ceux-là, d’autant que les règles de filtrages peuvent être diffusées à plusieurs de leurs clients, avec donc des effets de bords.

Et c’est juste la partie émergée de l’Iceberg. La nouvelle mode est à l’antispam avec apprentissage machine (ouais une fois les buzzword traduits ça fait moins marketing hein), reposant en partie sur les « retours utilisateurs », ou sur d’autres critères nécessairement flous parce que leur intérêt repose dans l’aspect propriétaire et donc fermé de leur fonctionnement. Là aussi, quand vous êtes un bon élève et qu’on vous envoie en colle sans vous expliquer pourquoi, c’est frustrant, et obtenir les informations pour réparer le tort est toujours pénible, pour les mêmes raisons que dans la partie précédente. Microsoft est devenu le roi à ce petit jeu là, et son autisme quand il s’agit de savoir pourquoi c’est arrivé et comment s’en prémunir est vraiment une purge, bon courage.

Ce que j’ai pu apprendre d’expérience, c’est que si vous n’êtes pas déjà un acteur reconnu opérant du mass mailing, un envoi important simultané sur une destination unique (un Microsoft ou un Google, au hasard, vu les milliards de boites mails qu’il gèrent au quotidien), peut augmenter votre score définissant si vous êtes un spammeur ou pas, quand bien même toutes les adresses de destination ont été volontairement indiquées par leurs utilisateurs. La magie étant de savoir comment vous allez pouvoir être reconnu si vous ne pouvez pas envoyer de mail, du moins pas de ceux que verrons les utilisateurs pour juger d’eux-même si c’est vraiment un spam ou pas, puisqu’ils seront classés par défaut (un renversement de preuve qu’on retrouve dans la loi Hadopi au passage, où vous êtes coupable tant que vous n’avez pas prouvé le contraire). Un prestataire de mass mailing d’un client, lors d’une conférence téléphonique finalement destinée à apprendre au client que les seuls à faire la loi, c’était Microsoft, Google, AOL, Yahoo, nous indiquait que lorsqu’il devait ajouter de nouvelles machines à sa plateforme (et donc de nouvelles adresses IP), il devait les « chauffer », c’est à dire commencer par lui faire envoyer de très petites quantités, et les augmenter au fur et à mesure. Et qu’il passait un temps fou à surveiller le statut de chaque machine de sa ferme d’envoi pour éviter le moindre problème. Regardez comment semble fonctionner Microsoft, les commentaires sont tout aussi édifiants, et encore, ça parle d’auto-hébergement, et ça ne parle pas de la nouvelle boite de réception « prioritaire » censé fonctionner en analysant votre utilisation de la boite fournie (mais qui fout en nom prioritaire des mails sur une boite neuve, sans utilisation…). Dernièrement FAIMaison, un fournisseur d’accès à Internet associatif proposant parmi ses services des boites mail, recommande aussi de quitter Microsoft parce que de moins en moins de plateformes peuvent leur envoyer des mails sans être emmerdés.

Dernièrement, j’ai appris que les plateformes de mail ne voulaient plus de courrier provenant de clouds publics. En tout cas dans l’immédiat, les IP « élastiques » attachées à des instances EC2 sont considérées comme dynamique et à les entendre, c’est le mal; j’imagine que les autres plateformes proposant des instances à la seconde sont dans la même situation. Donc c’est raté si vous voulez vous auto-héberger également hein, les IP ADSL c’est pas bien non plus, même si c’est fixe (déjà quand l’opérateur ne vous interdit pas cette possibilité, n’est-ce pas Orange ?), parce qu’on s’est tapé pendant des années, « grâce » à Microsoft d’ailleurs, des armées de PC Zombies dans les chaumières proposant des pilules bleues de la joie. En soi je peux comprendre ce point, il est vrai que le cout très faible et la très grande facilité de déploiement rend évidemment difficile d’établir une réputation stable pour l’adresse IP, mais c’est toujours dommageable, surtout quand vous avez une instance debout depuis trois ans et que d’un coup on vous dit « non t’es plus en odeur de sainteté » alors que t’as toujours été un bon soldat du mail propre. Ceci dit les solutions existent, chez Amazon une des options est de passer par leur service SES, mais qui a un coût supplémentaire à intégrer dans votre activité évidemment. Vous vous retrouvez donc à payer plus pour pouvoir rendre le même service, on se croirait dans les négociations TF1-diffuseurs en ce moment.

Un dernier point qui échappe à beaucoup de monde tant qu’on s’intéresse pas aux protocoles eux-même, l’échange en clair. Eh oui, le mail est né avant le DNS qui lui date du début des années 80, et tout comme le HTTP, le FTP, et d’autres protocoles historiques, tout est transmis en clair par défaut, donc un intermédiaire peut lire le contenu au passage sans difficulté. Google a commencé en 2017 à marquer et alerter ses utilisateurs quand un courrier a été envoyé en clair, et prévoit cette année d’intégrer ce point dans le calcul de SPAM; j’imagine qu’il ne va pas être le seul à opérer ce changement. Fort heureusement, une fois n’est pas coutume les solutions sont simples à mettre en place, pour ma part j’ai fait pousser 4 lignes sur les serveurs CentOS 6 et 7 de tous nos clients pour utiliser le TLS quand c’est disponible, et ça fait admirablement le boulot à peu de frais, je vous recommande donc de le faire aussi (d’ailleurs faut que je jette un œil à mes serveurs également). C’est même devenu une RFC, autrement dit un standard dans l’univers d’Internet, autant dire que là, personne n’a plus d’excuse d’autant que c’est simple à mettre en place. Car oui, le TLS ne sert pas qu’au web.

Et je pourrais probablement continuer longtemps si ma mémoire n’était pas aussi défaillante. On pourrait évoquer le fait que certains serveurs de mails de destination s’affichent hors-ligne plutôt que de vous dire que vous êtes blacklistés–ou plutôt un filtrage réseau est effectué sur la base des blacklist–, d’autres ne mentionnant pas la raison des refus dans leur réponse (à part juste un « 550 » sans plus de détails, ce code pouvant regrouper plusieurs types d’erreurs, que je vous invite à découvrir ici–en écartant très vite l’horrible message demandant de s’inscrire à une mailing list, ahah).

La réception, l’herbe est-elle plus verte ?

Admettons que vous choisissiez d’héberger et opérer un serveur de réception. Une partie de la théorie est commune avec le paragraphe précédent, car généralement un serveur de réception est aussi utilisé pour répondre, et donc en envoyer (mais d’utilisateur à utilisateur, alors que je présentes les chose plutôt de plateforme web à utilisateur). SPF, DKIM, DMARC, les deux derniers étant un poil plus trickys à mettre en place si plusieurs domaines sont hébergés sur la même plateforme. Idem pour la réputation de l’adresse, ou le chiffrement des communications entrantes et sortantes.

Je ne m’attarderai pas sur les solutions techniques à utiliser, tant qu’il est possible de faire à peu près tout ce que je viens de dire, le choix des outils vous appartient. Là où ça va commencer à être la joie, c’est que par définition, vous allez moins contrôler le contenu du message, ni la sécurité des comptes installés.

On démarre avec les comptes utilisateurs, et la gestion déplorable de leur sécurité. Très souvent, attendez-vous à entendre qu’une boite « s’est fait pirater » pour découvrir que le mot de passe faisait à peine trois caractères, autant dire que soit par un moyen tiers soit par bruteforce ça ne tient longtemps. Dans tous les cas, en dessous de dix caractères c’est pas la peine d’envisager qu’un utilisateur aura construit un mot de passe robuste et unique. Même moi je ne suis pas encore un bon élève de la gestion de mes mots de passes sur les différents services (j’en ai identifié plus de quarante). Si jamais le compte se fait trouer pour procéder à des envois massifs, préparez-vous à devoir gérer le blacklistage de l’adresse du serveur. Je conseille alors d’avoir plusieurs adresses, et de basculer sur une autre (une ligne dans un master.cf de postfix) le temps de faire les démarches auprès des gestionnaires de blacklists une fois les accès sécurisés. Imposer un minimum en termes de taille ou de complexité de mot de passe est toujours compliqué, et je n’ai pas de conseil définitif à apporter à ce sujet pour l’instant. D’autant que si pour les webmails ont peut toujours mettre en place de la double authentification, c’est beaucoup plus compliqué sur SMTP et IMAP qui ne sont pas prévus pour.

Si votre serveur doit héberger un nombre significatif de boites, il faudra probablement mettre des limites de nombres de mails à envoyer en simultanés, pour s’éviter le problème de refus évoqué plus haut en termes de mass mailing. Vous pensez que je délire ? Orange m’a déjà retardé pour la livraison d’un seul mail, en me demandant de réduire la cadence. Un seul. Pareil, pour faire bouger Orange, je vous souhaite bon courage.

Qui dit utilisateurs dit, et je suis désolé de le dire comme ça, incompétence totale. J’ai déjà commencé à aborder le sujet avec la gestion des mots de passe, c’est que le début. Vous aurez à régler les problèmes de quota (parce qu’ils ne sauront pas d’eux-même faire le ménage dans leurs anciens mails), les soucis de flux liés au fait qu’ils sont sur des réseaux bien filtrés de partout, avec leur appareil, le combo étant le wifi ouvert non chiffré avec portail captif, genre celui de la cité des sciences que je déconseille fortement. Ne pas évoquer les soucis de configuration des différents clients serait grossier de ma part, vous allez devenir un expert sur la plupart des logiciels du marché tous OS confondus, même ceux des plateformes que vous voulez éviter comme la peste, afin que votre service soit rendu. Prévoyez une interface la plus facile d’accès et la plus automatique possible pour la réinitialisation de mot de passe, parce que ceux qui ne l’auront pas stocké quelque part (sur un post-it évidemment), l’oublieront en permanence s’il n’est pas déjà utilisé sur la tétrachiée d’autre services sur lesquels ils sont inscrits vendus. Dans les éléments magiques aussi, on retrouve la gestion des mails en queue mais impossible à expédier parce que l’adresse saisie n’est pas valide (une fondation a des comptes sur son site dont plusieurs adresses mails sont en encore en voila.fr, service fermé il y a déjà plusieurs années maintenant, ou des gens qui pensent qu’il est possible d’avoir une boite mail en google.fr).

D’un côté plus technique, blindez le serveur que ce soit au niveau pare-feu ou protections supplémentaires. Je ne sais pas si c’est facile à mettre en place, mais par exemple si vous pouvez détecter une tentative de bruteforce sur un compte, il sera plus prudent de le verrouiller le temps de prendre des mesures à l’encontre de l’attaquant, tant pis pour la dégradation pour un client, vous avez tout le reste qui en dépend. Les attaques distribuées se multiplient (remember les instances publiques jetables), mais un moyen, typiquement fail2ban, de bannir temporairement l’adresse d’un attaquant permettra de réduire l’efficacité de celui-ci. Il y a d’ailleurs un point à surveiller : gérer un flot d’attaques demande des ressources, parfois musclées si le nombre de boites est important. Pensez aussi à redonder votre plateforme, afin de garantir une plus haute disponibilité. Je n’ai jamais eu à le faire, donc je ne connais pas bien les techniques exploitables pour ça, je vous laisse chercher si vous êtes concernés.

Et c’est sans doute pas tout 🙁

Je pense que c’est déjà un super pavé, et je vous suis reconnaissant si vous avez tenu jusqu’au bout. Malheureusement, je suis à peu près certains qu’il reste encore des choses à dire, des cas ou des spécificités que je n’ai pas pu traiter car je ne les ai pas encore rencontrés dans le cadre de mon travail, ou même à titre personnel (je n’héberge pas ma boite principale, je laisse ça à OVH, mais les boites clantoc.org oui). Donc si vous avez lu d’autres retours comme celui-ci, ou que vous souhaitez partager, compléter ou corriger des points abordés ici, faites-vous plaisir en commentaires. Moi je retourne à d’autres bricoles dont je vous parlerai bientôt 😉