Toute l’équipe du Big Data Hebdo vous souhaite une bonne année 2021, meilleure que 2020 avec plein de beaux projets data notamment !
Pour démarrer cette nouvelle année, nous lançons un format brève. Elles vont reprendre les liens issus du Slack et dont on ne parlera pas forcément dans les épisodes…
Les brèves devraient être publiées les semaines sans épisodes 😉
Cette première édition est un peu longue car elle reprend une bonne partie des liens partagés durant le mois de décembre et jusqu’à ce jour - les prochaines versions devraient être plus digestes !
Bonne lecture !
Algo
- Raft does not Guarantee Liveness in the face of Network Faults via Benoit Rousseau
- In Search of an understandable consensus algorithm (Extended version) via Benoit Rousseau
Analytique
- Firebolt launches with $37 million in funding | Firebolt via Joel Narigueta
- Dropbox migrates to Amazon S3 analytics data lake via Sébastien Stormacq
- Welcoming Dataform to BigQuery: Create and manage your data transformations within your data warehouse | Google Cloud Blog via Nicolas Steinmetz
- Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics via Quentin Ambard
- Build a Python Flask API for your Delta Lake via Paul Péton
- Natively Query Your Delta Lake With Scala, Java, and Python via Paul Péton
Cloud
- The Cloud Architect – Medium via Sébastien Stormacq
- AWS Lambda - 7 things I wished someone told me | by Charles Malafosse | Dec, 2020 | Towards Data Science via Julien Laurenceau
- Adoption of AWS Lambda Serverless Stalls – The New Stack via Nicolas Steinmetz
- Avec Azure PurView, Microsoft s’attaque à la gouvernance des données - Le Monde Informatique via Paul Péton
- New – Amazon EMR on Amazon Elastic Kubernetes Service (EKS) | AWS News Blog via Lucien Fregosi
- Dharma Shukla: TLA+ at Microsoft to build planetary-scale systems - Keynote TLA+ Community Event - YouTube via Pierre Zemb
- GitHub - codeforcloud/tf-anthos-on-ovh via Nicolas Steinmetz
- AWS Introduces New Instance Types for Amazon EC2 via Alexander Dejanovski
- Palantir rejoint Gaia-X via Youen Chéné
- Announcing HashiCorp Terraform 0.14 General Availability via Nicolas Steinmetz
Containers et orchestration
- k8s: the future of security via Loic Tosser
Database
- MySQL Database Service Analytics Engine and Oracle Cloud Infrastructure: Run applications and analytics with better performance, scale and efficiency via Joel Narigueta
- Feature Casualties of Large Databases — brandur.org via Adrien Nayrat
- Fauna | Comparing Fauna and DynamoDB via Julien Laurenceau
- New – Amazon DynamoDB Transactions | AWS News Blog via Sébastien Stormacq
- Trino | We’re rebranding PrestoSQL as Trino via Vincent Heuschling
- Evolution of tree data structures for indexing: more exciting than it sounds · Erthalion’s blog via Adrien Nayrat
- Playlist PGCon 2020
Hadoop
- Cloudera - Paywall Expansion via Paul Manfred
Hardware
- Why Is Apple’s M1 Chip So Fast? | Debugger via DOAN Duy Hai
- Modern Microprocessors - A 90-Minute Guide! via DOAN Duy Hai
- Research: Stealing data from air-gapped PC by turning RAM into Wi-Fi Card via Julien Laurenceau
- Intel falls on report Microsoft will design own chips for PCs, servers via Julien Laurenceau
- What Is Innovative About RISC-V?. The first thing you hear about RISC-V… | by Erik Engheim | The Startup | Dec, 2020 | Medium via DOAN Duy Hai
Machine Learning
Observabilité
- Vector - A lightweight and ultra-fast tool for building observability pipelines | Vector via Nicolas Steinmetz
- Google Releases Monitoring Query Language for Cloud Monitoring into General Availability via Nicolas Steinmetz
- Introducing Monitoring Query Language, or MQL | Google Cloud Blog via Nicolas Steinmetz
Remote
- No Office, No Problem: Software Unicorn Gitlab’s CEO Warns You’re Probably Doing Remote Work Wrong via Julien Laurenceau
Streaming
- Apache Pulsar 2.7.à via Pierre Zemb
- Apache Flink: Apache Flink 1.12.0 Release Announcement via Nicolas Steinmetz
Tendances et prospective
- Ma liste de tendances technologiques 2021 via Nicolas Steinmetz
- NoCloud, revenir sur terre ? via et par Paul Péton
Meetup & conférences
- Paris Time Series #9 - Comment gérer la labellisation des séries-temporelles et la détection d’anomalies grâce à InfluxDB ? via Nicolas Steinmetz
- C2C - The independant Google Cloud Community - Section France via Vincent Heuschling
- AI Meets Product - Quelle UX avec l’intelligence artificielle ? via Christophe Tricot