saltar al contenido

Cómo funciona el algoritmo de Facebook

Como funciona el algoritmo Facebook? Una pregunta de 1 Millón de dólares.

Todos los días leo decenas de guías y noticias sobre todo lo que pasa en el mundo digital..

Suelen ser guías muy útiles a veces menos.

Para esto hemos creado el nuestro Canal de Telegram de Confucionet para seleccionar las mejores noticias y actualizaciones sobre el mundo de la web.

Cómo funciona el algoritmo de Facebook 1
Canal de Telegram Confucionet

Ayer mismo, mientras me desplazaba por las diversas noticias del blog oficial de Facebook, se publicó esta publicación..

¿Cómo predice el servicio de noticias lo que desea ver??

de Akos Lada, Gerente de ciencia de datos, Meihong Wang, Director de Ingeniería, y Tak Yan, Director de gestión de productos de Facebook.

Ya que es uno fuente principal Decidí traducirlo y publicarlo directamente en nuestro blog., para obtener una descripción general de una fuente oficial sobre cómo funciona el algoritmo de Facebook.

Disfruta la lectura

Cómo predice News Feed lo que quieres ver?

Cuando se trata del algoritmo de suministro de noticias, hay muchas teorías y mitos.

La mayoría de la gente entiende que existe un algoritmo en funcionamiento y muchos conocen algunos de los factores que informan a ese algoritmo. (si te gusta una publicación o interactúas con ella, etc.).

Pero aún quedan muchas cosas incomprendidas.

Compartimos públicamente muchos de los detalles y características de News Feed.

Pero bajo el capó, el sistema de clasificación de aprendizaje automático (ML) ese alimenta News Feed es increíblemente complejo, con muchos niveles.

Compartimos nuevos detalles sobre como funciona nuestro sistema clasificación y los desafíos de construir un sistema para personalizar el contenido para más que 2 miles de millones de personas y mostrarles a cada una de ellas contenido que sea relevante y significativo para ellas, cada vez que vienen a Facebook.

¿Qué hay de difícil en esto??

Ante todo, el volumen es enorme.

Más que 2 miles de millones de personas en todo el mundo usan Facebook.

Para cada una de estas personas, hay más de mil puestos de candidatos” (o publicaciones que podrían aparecer en el feed de esa persona).

Ahora estamos hablando de billones de publicaciones en todas las personas en Facebook.

Ahora considere eso para cada persona en Facebook, Existen miles de signos que debemos evaluar para determinar qué podría encontrar esa persona más relevante.

Tenemos billones de publicaciones y miles de señales y necesitamos predecir de inmediato lo que cada una de estas personas quiere ver en su feed..

Cuando abres Facebook, ese proceso ocurre en segundo plano en el segundo más o menos para cargar su feed de noticias.

Y una vez que todo esto funcione, las cosas cambian y hay que tener en cuenta los nuevos problemas que surgen, como clickbait y la propagación de la desinformación.

Cuando eso pasa, tenemos que encontrar nuevas soluciones.

En realidad, el sistema de clasificación no es solo un algoritmo único; hay varios niveles de plantillas de AA y clasificaciones que aplicamos para predecir el contenido más relevante y significativo para cada usuario.

A medida que avanzamos en cada etapa, el sistema de clasificación reduce esos miles de publicaciones de candidatos a los pocos cientos que aparecen en las noticias de alguien en un momento dado.

Feed de noticias de Facebook de Algoritmo

Como funciona?

En lenguaje sencillo, el sistema determina qué publicaciones aparecen en su feed de noticias y en qué orden, predecir lo que es más probable que le importe o comprometa.

Estas predicciones se basan en una variedad de factores, incluido que y a quien seguiste, me gustó o interactuó con recientemente.

Para entender cómo funciona en la práctica., comencemos con lo que le sucede a una persona que inicia sesión en Facebook: lo llamaremos Juan.

Desde el acceso de Juan ayer, su amigo Wei publicó una foto de su cocker spaniel.

Otro amigo, Saanvi, publicó un video de su carrera matutina.

Su página favorita tiene un artículo interesante sobre la mejor manera de ver la Vía Láctea de noche., mientras que su grupo de cocina favorito ha lanzado cuatro nuevas recetas de masa madre.

Es probable que todo este contenido sea relevante o interesante para Juan porque ha elegido seguir a las personas o páginas que lo comparten..

Para decidir cuál de estas cosas debería aparecer más arriba en el News Feed de Juan, tenemos que predecir qué es lo más importante para él y qué contenido tiene el mayor valor para él.

En terminos matematicos, necesitamos definir una función objetivo para Juan y realizar una optimización de objetivo único.

Podemos utilizar las funciones de una publicación., como quién está etiquetado en una foto y cuándo se publicó, para predecir si a Juan le gustará .

Por ejemplo, si Juan tiende a interactuar a menudo con las publicaciones de Saanvi (por ejemplo, compartir o comentar) y su video en ejecución es muy reciente, hay una alta probabilidad de que a Juan le guste su publicación.

Si Juan ha tratado con más contenido de video que fotos en el pasado, la predicción similar para la foto de Wei de su cocker spaniel podría ser bastante baja.

En este caso, Nuestro algoritmo de clasificación clasificaría el video en ejecución de Saanvi más alto que la foto del perro de Wei porque predice una mayor probabilidad de que a Juan le guste..

Pero el placer no es la única forma en que las personas expresan sus preferencias en Facebook.

Todos los días, las personas comparten artículos que les parecen interesantes, ven videos de personas o celebridades que siguen o dejan comentarios serios en las publicaciones de sus amigos.

Matemáticamente, las cosas se vuelven más complejas cuando tenemos que optimizar para múltiples objetivos que se suman a nuestro objetivo principal: crear valor a más largo plazo para las personas mostrándoles contenido significativo y relevante para ellos.

Más modelos de AA producen más predicciones para Juan: la probabilidad de interactuar con la foto de Wei, El video de Saanvi, el artículo de la Vía Láctea o recetas de levadura natural. Cada modelo intenta clasificar estos contenidos para Juan.

A veces no estoy de acuerdo: Puede haber una mayor probabilidad de que a Juan le guste el video de carrera de Saanvi que el artículo de la Vía Láctea., pero puede estar más inclinado a comentar el artículo que el video.

Por lo tanto, necesitamos una forma de combinar estas diferentes predicciones en una puntuación optimizada para nuestro objetivo principal de valor a largo plazo..

¿Cómo podemos medir si algo crea valor a largo plazo para una persona?? Les preguntamos.

Por ejemplo, Entrevistamos a las personas para preguntarles qué tan significativa encontraron una interacción con sus amigos o si una publicación valió su tiempo para que nuestro sistema refleje lo que las personas dicen que les gusta y encuentran significativo..

Para que podamos tener en cuenta todas las predicciones para Juan en función de las acciones que nos dicen las personas. (a través de encuestas) son más significativos y valen su tiempo.

Pelar las capas

Para clasificar más de mil publicaciones por usuario, por día, Por más de 2 miles de millones de personas – en tiempo real – tenemos que hacer que el proceso sea eficiente.

Lo gestionamos en varios pasos, organizados estratégicamente para hacerlo más rápido y limitar la cantidad de recursos informáticos necesarios.

Ante todo, el sistema recopila todas las publicaciones de candidatos que eventualmente podemos clasificar para Juan (la foto del cocker spaniel, el video corriendo, etc.).

Este inventario elegible incluye cualquier publicación compartida con Juan por un amigo, un grupo o página a la que está vinculado que se creó desde el último acceso y no se ha eliminado.

Pero, ¿cómo debemos manejar las publicaciones creadas antes del último inicio de sesión de Juan que aún no ha visto??

Para asegurarse de que las publicaciones no vistas se reconsideren, aplicamos una lógica de golpes no leídos: nuevas publicaciones que han sido calificadas para Juan (pero no visto por el) en sus sesiones anteriores se agregan al inventario elegible para esta sesión.

También aplicamos uno lógica de bloqueo de acciones para que todas las publicaciones que Juan ya ha visto y que desde entonces han desencadenado una interesante conversación entre sus amigos se agreguen al inventario elegible.

Después, el sistema debe calificar cada publicación por una serie de factores, como el tipo de publicación, la similitud con otros elementos y cuánto se corresponde la publicación con lo que Juan tiende a interactuar.

Para calcular este valor por más de 1.000 enviar, para cada uno de los miles de millones de usuarios, todo en tiempo real, ejecutamos estos modelos para todas las historias candidatas en paralelo en varias máquinas, llamados predictores.

Antes de combinar todas estas predicciones en una sola puntuación, tenemos que aplicar algunas reglas adicionales.

Esperamos hasta que obtengamos estas primeras predicciones para poder reducir el grupo de publicaciones para clasificar y aplicarlas en varios pasos para ahorrar potencia de cálculo..

Ante todo, Se aplican ciertos procesos de integridad a cada puesto..

Estos están diseñados para determinar qué medidas de detección de integridad, Si alguna, debe aplicarse a las historias seleccionadas para la clasificación.

En el siguiente paso, un modelo ligero reduce el grupo de candidatos a aprox. 500 de los lugares más relevantes para Juan.

Clasificar menos historias nos permite utilizar modelos de redes neuronales más potentes para los siguientes pasos..

El siguiente es el pase de puntuación principal., donde tiene lugar la mayor parte de la personalización.

OMS, una puntuación para cada historia se calcula de forma independiente, entonces todo 500 las publicaciones están ordenadas por puntuación.

Para algunos, la puntuación puede ser más alta para los me gusta que para los comentarios, ya que a algunas personas les gusta expresarse más gustando que comentando.

Cualquier acción en la que una persona rara vez participa (por ejemplo, un pronóstico similar que está muy cerca de cero) obtiene automáticamente un papel mínimo en el ranking, ya que el valor esperado es muy bajo.

Finalmente, realicemos el pasaje contextual, donde se agregan características contextuales como reglas de diversidad de tipos de contenido para asegurarse de que el servicio de noticias de Juan tenga una buena combinación de tipos de contenido y ya no vea publicaciones de video, uno después del otro.

Todos estos pasos de clasificación tienen lugar en el tiempo que le toma a Juan abrir la aplicación de Facebook y, en segundos, tiene un servicio de noticias de puntuación listo para que lo explore y disfrute.

Fuente: ¿Cómo predice el servicio de noticias lo que desea ver??

Simone Stoppioni
Últimos mensajes de Simone Stoppioni (ver todo)
Resumen
Revelado cómo funciona el algoritmo de Facebook
Título
Revelado cómo funciona el algoritmo de Facebook
Descripción

Una descripción general de cómo funciona el algoritmo de Facebook tomado de una fuente oficial.