Episode 147 : Small data and MLops stacks

19/09/2022    cve ai parquet dbt mlops smalldata dataquality shell 

Apéro

Database

Data-science (en production)

Outils

Orateurs

Sponsors

Cette publication est sponsorisée par Affini-Tech et CerenIT.

CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi sur Time Series France.

Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! Affini-Tech, La plateforme Datatask pour accélérer vos services Data et IA.

On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à recrutement@affini-tech.com

Le générique a été composé et réalisé par Maxence Lecointe.

Nuage de tags

bigdata aws postgresql kubernetes cassandra azure databricks france kafka timeseries spark cloud warp10 snowflake apache google ovhcloud grafana hadoop ia python sql docker pulsar interview dbt mongodb nosql trino data-science flink bigquery influxdb news timescale foundationdb clickhouse elastic redis rust arm datastax java microsoft s3 scaleway sqlite terraform confluent data mysql nvidia serverless datalake gcp googlecloud influxdata machine-learning rgpd clever-cloud europe github iot mlops vscode ai cloudera cnil cockroach facebook hashicorp lakehouse machine_learning sécurité arrow aurora cockroachdb database databases delta haskell jupyter ml notebook opensource pinot prometheus quickwit redshift spanner streaming superset yugabyte apple architecture catalog cdc cloud-souverain data-mesh datascience docker-compose gaia-x gdpr gke huggingface jetbrains metabase palantir pandas raft redpanda scikit-learn search senx souveraineté agpl airflow aiven beam bookkeeper cloudflare cncf compose copilot dataiku datatask dataviz datawarehouse delta-lake devoxxfr dynamodb eks elasticsearch etcd etl feature-store firebolt french golang ibm jepsen kernel lambda lucene mesos nocode opensearch oss parquet postgres privacy pycaret pytorch questdb r raspberrypi rds scylla storage timescaledb traefik vector zookeeper algolia amd analytics anthos atlassian bi blockchain bloom-filter consul containerd couchbase covid19 dagger data-engineering datadog dataflow datamesh doctolib duckdb ebpf ec2 elixir exoscale flows git gitpod google-analytics gpu helm hudi json log4j maif mapr mimir mqtt neo4j netapp netflix nlp nomad oracle phoenix powerbi presto prophet quantique rabbitmq risc-v salesforce slack sncf ssd streamlit synapse tikv time-series 2019 airbyte aks alertes amazon analytique api atos automl babelfish benchmark biglake bintray cabourotte centos chine citus cloud-de-confiance collibra cookie cosmosdb couchdb cube cve dagster dash data-catalog data-engineer datageek dataops dataplex datarobot delta-live delta-sharing deltalake dhakira discovery dremio druid elt emr euclidia event excel faq fastapi faunadb flask frenchtech gaiax gartner gitlab gpt-3 health-data-hub hive iam iceberg ingestion inria instacluster intellij istio jcenter jdk jfrog julia k8ssandra kapacitor kestra knative kotlin licence linux log log4shell lsf m3db malloy memcached memsql metaverse micro-service microservice microsoft-sql-server minio mirabelle mlflow n8n nft nodejs noel npm nrtsearch okta openjdk operator orange orchestration ovh paxos pgsql planetscale podman prestodb prestosql privacy-shield qemu qovery r2 radar registryops rlang rocksdb rook sagemaker scylladb secnumcloud shell sigfox small-data solr spring sql-server ssh starburst starbust stargate state streamnative tableau tabular talend telegraf tempo test thales thematique timestream uber usa vault velero vitess voltron warpstudio wasm wifi zig 2017 accenture accord actors actu acv adoptium adoptopenjdk aeure agrocd akami akhp akka alerts alibaba alloydb allydb almalinux amado analyse android angular anniversaire anomalie anomaly-detection anthropic apache-arrow apache-druid apache-pinot apache-yunikorn apachespark arcadedb archive archlinux argo-cd articdb assembly astradb astria astro astronomer atlas audacity augly aurads auth0 authentication authorization authz automatisation automerge autopilot avanade aws-summit azure-ml back-market backblaze backup ballisa bash berkeleydb bert bgp biais biscuit bitcoin bleu bnp bodywork bootstrap bpi bpifrance broadcom business calcite calvin cap-theorem carbondata carrefour cdn celery ceph ceresdb cgroups chaosdb chiffrement cicd classification cli clockhouse cloudact cluster-api clusterset cobol code-whisperer codecov codeurs-en-seine collecte colossus comptabilité conduktor conference conseil consensus consul-connect container conteneurs cookies cortex coscreen course-au-large covid-19 cpu craftsmanship criteo crux crypto cryptomonnaie csi csv cuda cue culture cybersécurité d1 dall-e dalle dashboard dask data-discovery data-gouvernance data-platform data-prep data-quality data-vault data-wrangling dataform dataframes datafusion datagouv datahub datakin datalakehouse dataops.rocks datapreparation dataproc dataquality datasearch datasketches datastack dbscan ddos debezium deep-fake deep-learning delos deployment devfest-lille dewitt diagram diagrams digital direct distinct distributed distributed-systems django docker-desktop dockershim documentdb dolt dragonfly drift driftctl drill ebs echantillonage echart ecs egress entreprise entreprise4.0 epyc erlang eurybia exadata expert-comptable explicabilité exploration falco faster fb feast feature finalizer fiscal flaml flight forecast fourier francais freebsd freenode french-tech ftp fugue fundings futur gafam gc geopandas geospatial gil github-actions gitlab-ci gitops gladia glitchtip glue gobblin google-ads google-app-engine google-appengine google-font gourvernance gouvernance gp3 gpg graph graphql graviton gravitron gunicorn hamilton hashicorrp hasicorp haskel hbase hdd hdh hex hfactory hfiles hibernate hop http husky image impala imply incident indexes indexima industrie industrie-4.0 inflation influx infomaniak instaclustr internet interopérabilité iops iouring iox ipo ipv4 ipv6 jedi jespen jinja jpa jquery jvm k6 k8s k8saandra kaggle kalman-filter kappa kapsule kata-container kensu kibana kinesis komodor ksqldb kubecon kubectx kubeflow kubens kuma lake-formation leap-second ledger lens letsencrypt letsencrypy license lighton ligthdash lineage linkbynet linkedin linky linode linter litestream lobe logica logiciel-libre loki low-code lowcode lru lsm-tree légal m1 machinelearning mangodb manticore-search mapie mathématiques matillion matrix medusa memcache memorydb messaging meta metadata metrics meuse microsoft-build microsoftazure mirantis mmap modèle-relationnel modélisation monolith monolithe mpp msgpack msgspec multi-cloud musk méthodologie namespace netgear network newsletter newsql nifi no-code nodb nsa ntp numérique nvme object-storage observability observabilitycon ocaml olap onehouse opacus open-policy-agent openai opendatasoft openlineage opensourcesoftware p99conf paas pagnol pandera partitionning password pcie performance pex pgcon pgrest pi pinterest pixie pixley plateforme pluralith podcast poetry polardb pony posgresql pranadb process processeur prolog prospective psp pub-sub pulumi pushmetrics pyre pyscript qlik qualité quantmetry quasardb query querybook quic quorum r2devops radix ram rancher rapport-gauvain re-invent readme readyset reapder recommendation redash redhat reed-salomon reinvent replibyte retention-policy reverse-etl rhel ribbon-filter riscv roblox rockset rockylinux rondb rpgd rppd rsync rtc rust-vmm salaire santé satellite scalabilité scrapping security.txt select server-less service service-mesh servicediscovery servicemesh shapash shapsh shard shards shotover simulation singer slideshare smalldata snapash snapshot snoflake snowpark software souveraineté-numérique sowflake splunk spot sre srecon stable stack-overflow starlight startree startup statefulset statistiques steamsets streams sudo suisse supply-chain-attack suse syntec sysdig système-distribué tanzu tar tdengine teads tech terality tesla the-last-pickle thoughtworks thématique tiered-storage tigerbeetle tigergraph tigris tika tla+ tls tomcat tpc transformation trasnformers trifacta trinot tsfr twitter u-sql ua-parser-js ubeeko udap udf unikernel union-européenne upsert usage usb vc vectorized vertex vie-privée vm vmware voile voilà voix warehouse warp.dev wasi web web-components webassembly webassmelby wikimedia workflow ydb yelp zanzibar zeenea zepl zeppelin zevent zstd éthique

Syndication

Restez informé(s) de notre actualité en vous abonnant au flux des épisodes, des brèves ou abonnez-vous au podcast dans votre application favorite

Le podcast est sponsorisé par Affini-Tech et CérénIT

À compter de l'épisode 104, le générique a été composé et réalisé par Maxence Lecointe

© 2014-2022 | Contenus sous licence Creative Commons BY-SA