Invitado: Zihao Li, estudiante de doctorado en la Universidad Politécnica de Hong Kong
Organizado por: Aididiao.eth, Foresight News
Este artículo es un resumen del vídeo compartido por Zihao Li, estudiante de doctorado de la Universidad Politécnica de Hong Kong en el Programa Web3 Young Scholars. El programa Web3 Young Scholars, lanzado conjuntamente por DRK Lab, imToken y Crytape, invitará a jóvenes académicos de renombre en el campo del cifrado a compartir algunos de los últimos resultados de las investigaciones con la comunidad china.
Hola a todos, soy Zihao Li, estudiante de doctorado de tercer año en la Universidad Politécnica de Hong Kong. El tema que compartiré hoy es "Revelar las actividades MEV en el paquete de transacciones Ethereum". En pocas palabras, se trata de cómo descubrir tipos desconocidos de actividades MEV en la red Ethereum a través de paquetes de transacciones. Primero, daré una introducción de antecedentes relativamente básica, como el concepto de MEV, el mecanismo del paquete de transacciones y los antecedentes de nuestro trabajo. Luego, presentaré el flujo de trabajo completo y algunas ideas de diseño en detalle, como en qué principios de diseño está diseñado el flujo de trabajo; cuáles son nuestros conjuntos de datos; qué herramientas utilizamos para evaluar nuestro flujo de trabajo y en qué indicadores, etc. Finalmente, presentaré tres aplicaciones que incluyen resultados de análisis empíricos relevantes.
Introducción a los antecedentes: MEV, paquete de transacciones, motivación
La actividad MEV significa que los arbitrajistas en la cadena de bloques generan transacciones de arbitraje monitoreando la red de la cadena de bloques, incluido el estado del bloque. Parte de la información de las transacciones se difunde en la red blockchain P2P, o algunas transacciones que no se han subido formalmente a la cadena se almacenan en el grupo de transacciones de mineros o verificadores. Cuando el arbitrajista monitorea esta información de transacciones, genera la suya propia a través de algunas estrategias. La transacción de arbitraje, y luego especifica la transacción de arbitraje en una determinada posición en el siguiente bloque, por ejemplo, quiere estar a la cabeza del siguiente bloque, o en otras palabras, ejecutar una transacción estratégica inmediatamente después de una determinada transacción para difundir el mismo comercio de arbitraje. De esta forma, para especificar actividades de arbitraje en una determinada ubicación, podemos considerarlas como actividades MEV. Por ejemplo, si un arbitrajista monitorea las fluctuaciones de los precios de los activos, puede comprar el activo correspondiente en un grupo de negociación con un precio bajo y luego venderlo a un precio alto en otro grupo con un precio alto, lo que se considera una actividad MEV.
En la actualidad, las actividades de MEA las llevan a cabo principalmente arbitrajistas en torno a la ecología DeFi, porque la ecología DeFi actualmente reúne principalmente activos. Hasta ahora, la ecología DeFi de Ethereum, incluidas otras cadenas, ha atraído más de 40 mil millones de dólares estadounidenses en capital. Aquí debemos mencionar un concepto sobre la ecología DeFi, llamado acción DeFi, que corresponde a la operación del servicio atómico proporcionado por una aplicación DeFi. Por ejemplo, sabemos que AMM admite el intercambio entre diferentes tipos de activos. Los usuarios pueden vender un USDC. y luego obtener una cantidad de ETH. Dicha operación se puede definir como una acción DeFi. Podemos utilizar la acción DeFi para expresar las actividades MEV. Por ejemplo, si un usuario detecta que hay una brecha en los precios de los activos en diferentes AMM, el usuario puede comprar barato y vender caro, y finalmente obtener la ganancia por diferencia de precio. Podemos expresar esta actividad MEV como dos acciones DeFi.
En la actualidad, la investigación académica sobre las actividades MEV se divide principalmente en tres categorías, a saber, ataques sándwich, arbitraje inverso y liquidación. En el conjunto de datos con el que trabajamos, encontramos que estos tres tipos de actividades MEV aparecen más de 1 millón de veces. En realidad, hay una pregunta aquí: después de conocer las definiciones de estas actividades MEV, ¿cómo identificar la ocurrencia de actividades? Si queremos identificar estas actividades MEV, necesitamos identificar todas las actividades del arbitrajista, como qué transacciones genera el arbitrajista y qué tipos de arbitraje se incluyen en estas transacciones. Luego podemos determinar qué tipo de actividad MEV está ocurriendo actualmente. ., y todo el proceso depende en gran medida de nuestra definición de actividad MEV conocida. Tome un ataque sándwich como ejemplo. Después de conocer la definición de un ataque sándwich, si queremos determinar el valor de arbitraje del ataque sándwich y sus transacciones de arbitraje correspondientes, debemos establecer muchas reglas basadas en la definición. y luego filtrar los ataques sándwich candidatos a través de estas reglas, valor de arbitraje y comercio. Al identificar de esta manera los tipos de ataques MEV conocidos, surgen dos preguntas: la primera es si las tres actividades MEV comunes que conocemos pueden representar todas las actividades MEV. Obviamente no, porque el ecosistema DeFi siempre está en desarrollo, siempre se están desarrollando nuevas aplicaciones y las estrategias de estos arbitrajistas en realidad se iteran constantemente. La segunda pregunta es cómo podemos descubrir estas actividades MEV desconocidas. Con esta pregunta en mente, echemos un vistazo al mecanismo del paquete de transacciones.
El mecanismo del paquete de transacciones se propuso por primera vez en 2021. En pocas palabras, los usuarios pueden organizar una cola de transacciones. La longitud de esta cola de transacciones puede ser una transacción o varias transacciones, y luego el usuario envía estas transacciones a la red blockchain. El retransmisor las recopila. transacciones y las envía directa y privadamente a los mineros o verificadores relevantes. Actualmente, los retransmisores ejecutarán paquetes de transacciones para realizar tareas de retransmisión. El mecanismo del paquete de transacciones tiene una característica muy importante: cuando estos usuarios construyen un paquete de transacciones, pueden colocar las transacciones de otras personas que no se han cargado en la cadena en un paquete de transacciones, y el orden de las transacciones en el paquete de transacciones se puede manipular arbitrariamente. . En este momento, el usuario del paquete comercial o el arbitrajista que utiliza el paquete comercial puede diseñar sus reglas de arbitraje. Por ejemplo, puede diseñar una estrategia más compleja y rentable para las actividades de MEV. Tomando el ataque sándwich como ejemplo, si no se utiliza ningún paquete de transacciones, un arbitrajista en un ataque sándwich necesita generar al menos un par de transacciones para lograr el arbitraje, y este par de transacciones de arbitraje solo puede apuntar a esta transacción. El arbitraje generado por esta transacción de ataque debe ejecutarse en un orden determinado para garantizar que se pueda arbitrar con éxito. Pero si un arbitrajista utiliza un paquete comercial, puede recopilar muchas transacciones que pueden ser arbitradas. Sólo necesita utilizar un par de transacciones de arbitraje correspondientes para generar arbitraje en múltiples transacciones al mismo tiempo. Mientras este paquete de transacciones esté en la cadena, definitivamente tendrá éxito en el arbitraje y, debido a que arbitra múltiples transacciones arbitrables al mismo tiempo, sus resultados de arbitraje también son más rentables.
El paquete comercial se caracteriza por actividades MEV muy ricas y complejas. Porque los usuarios que usan paquetes de transacciones encapsulan sus transacciones completas en el paquete de transacciones, luego las envían al retransmisor de la red P2P y finalmente a los mineros y verificadores correspondientes. Podemos identificar de forma precisa y completa todas las actividades a través de paquetes de transacciones. Por lo tanto, podemos identificar con mayor precisión algunas actividades MEV desconocidas a través del medio del paquete de transacciones.
Flujo de trabajo e ideas de diseño
A continuación, presentemos nuestro flujo de trabajo en detalle. ¿Cómo descubrimos actividades MEV desconocidas a través de un medio como un paquete de transacciones? El flujo de trabajo principal incluye dos herramientas. Primero, después de que el retransmisor recopila el paquete de transacciones, utilizamos la herramienta ActLifter para identificar cada acción DeFi en el paquete de transacciones. Después de obtener los resultados, representamos todas las acciones en el paquete de transacciones. . Luego use la herramienta ActCluster para agrupar paquetes de transacciones con actividades similares y descubra nuevas actividades MEV más rápido a través de los resultados de la agrupación. Si queremos descubrir actividades MEV desconocidas, inevitablemente necesitamos confirmar manualmente si la actividad MEV es de un tipo desconocido. Por supuesto, nuestro objetivo de diseño de trabajo es minimizar la carga de trabajo manual tanto como sea posible y hacer que todo el proceso sea lo más eficiente posible. posible Realizar automáticamente.
Ya existen herramientas que pueden identificar la actividad MEV a partir de transacciones. Podemos dividirlo aproximadamente en dos categorías: la primera categoría son reglas de resumen puramente manuales y la segunda categoría son reglas puramente heurísticas, es decir, el uso de una regla heurística puramente automatizada para identificar tipos específicos de actividades MEV. Por ejemplo, después de identificar cierta información de transferencia actual, verifica si se cumplen las reglas heurísticas y, de ser así, puede identificar la actividad correspondiente. El primer método de resumen de reglas puramente manual puede lograr una precisión relativamente buena, porque este proceso es un análisis completamente manual de aplicaciones específicas y luego puede garantizar que los resultados de la detección sean precisos, pero la tarea de análisis requiere una carga de trabajo muy grande, por lo que no puede cubrir todas las aplicaciones DeFi. Aunque el segundo trabajo puede ser puramente automatizado, las reglas heurísticas sólo pueden cubrir algunos tipos específicos. Por otro lado, existen algunos problemas en el diseño de las reglas heurísticas, lo que da como resultado una precisión de reconocimiento insatisfactoria.
Diseñamos nuestro flujo de trabajo combinando las ventajas de ambos métodos. Podemos identificar diez acciones DeFi importantes actualmente. Solo necesitamos determinar manualmente qué evento en la aplicación DeFi corresponde a qué tipo de acción DeFi después de iniciarse, entonces no necesitamos un análisis manual y podemos dejarlo completamente en manos del análisis automatizado. El segundo tipo de método puede identificar de forma completamente automática las acciones DeFi, pero no puede determinar si el objeto analizado está relacionado con actividades MEV. Por ejemplo, si identificamos una transferencia SWAP, es posible que identifique dos combinaciones de transferencias completamente independientes como una acción DeFi y, naturalmente, el resultado de su identificación será incorrecto. Pero podemos utilizar esta información para filtrar información que esté realmente relacionada con las acciones de DeFi. Luego de obtener esta información, podemos evitar algunos errores como los que ocurren en el segundo tipo de método mediante métodos automatizados.
Por ejemplo, aquí hay una transacción que involucra cuatro transferencias en total, y su orden de ocurrencia, cantidad de fondos y tipo están marcados con números de serie. En este proceso, AMM en realidad inicia un evento relacionado con la acción de intercambio. Una vez que el primer método determina que se inició el evento, necesita restaurar el contenido actual a través de algunos parámetros del evento. Por ejemplo, necesita observar el código, la lógica empresarial y algunas variables de función del contrato 699 para restaurar el contenido actual. Después de obtener esta información, diseñamos una regla basada en sus características únicas de transferencia de activos. Por ejemplo, la regla que refinamos es que el contrato que actualmente opera DeFi recibe y transfiere diferentes tipos de activos. Cuando encontramos que hay dos transacciones como esta Una vez que la transferencia de activos se ajuste a dichas características, podemos restaurar el contenido de la acción de intercambio correspondiente. El segundo tipo de método consiste en hacer coincidir directamente dos transferencias de activos: las dos cuentas de transferencia de activos recibieron y transfirieron diferentes tipos de activos. La primera y quinta transferencia se considerarán como un par de transferencias relacionadas, y la cuenta del medio se considerará AMM. Obviamente, podemos ver intuitivamente que el resultado de la identificación es inexacto.
Las reglas que resumimos a través del análisis manual son los tipos de acciones DeFi correspondientes a eventos relevantes. Aunque los resultados se resumen a través del análisis manual, todavía intentamos refinar el proceso de análisis manual en un proceso semiautomático para garantizar la confiabilidad de todo nuestro proceso. Consultaremos el sitio web oficial y la documentación para desarrolladores de aplicaciones DeFi, incluidos algunos códigos fuente de contratos, en los sitios web oficiales de DeFiPulse.com y Dapp.com. Desarrollamos herramientas de análisis que pueden extraer algunas descripciones de eventos en documentos de estos materiales involucrados, como cómo se define este evento con tokens y en qué funciones, fragmentos de código y comentarios de código donde se utilizan estos eventos. Después de extraer estas cosas, a través de nuestro análisis y discusión manual, finalmente determinamos que hay 88 eventos correspondientes a diferentes tipos de acciones DeFi.
Ingresamos la transacción a analizar en este diccionario y analizamos qué eventos ocurrieron en la transacción. Luego, cuando aparece un evento en este diccionario, extraemos información clave de acuerdo con las reglas correspondientes, como qué contrato opera esta acción DeFi, cuál es el tipo de esta DeFi y qué transferencias de activos están relacionadas con esta acción DeFi. Después de obtener dicho contenido, resumiremos las reglas características de la transferencia de activos y luego usaremos estas reglas para que coincidan con la acción final de DeFi. Partimos de la definición de diez acciones DeFi y resumimos las reglas características de la transferencia de activos. Después de recopilar esta información en el paso anterior, usaremos estas reglas de coincidencia y finalmente nos ayudarán a identificar qué contenido específico ocurrió en qué DeFi en esta transacción. Después de que ActCluster identifique cada transacción en el paquete de transacciones, podemos expresar el comportamiento del paquete de transacciones.
Primero comprendamos los principios de diseño de ActCluster. Sabemos que el análisis manual es inevitable en este proceso y debe depender del trabajo manual para determinar si la actividad del paquete de transacciones es un tipo desconocido de actividad MEV. En base a esto, nuestra idea básica es agrupar transacciones con actividades similares. Para cada grupo, solo necesitamos muestrear aleatoriamente uno o varios paquetes de transacciones para su análisis, lo que puede acelerar el proceso de análisis manual y, en última instancia, descubrir diferentes tipos de actividades MEA. Cuando utilizamos el análisis de conglomerados para agrupar paquetes de transacciones, nos enfrentamos a un dilema. Cuando establecemos la fuerza de agrupación de los paquetes de transacciones de manera relativamente aproximada, los paquetes de transacciones que contienen diferentes tipos de actividades se agruparán. En este momento, aunque el número de grupos se reducirá, las tareas de análisis manual correspondientes también se reducirán. Menos, pero Hay algunos eventos MEV nuevos que nos perderemos. Si ajustamos la intensidad de la agrupación para que sea más detallada, aunque podemos distinguir algunos paquetes de transacciones correspondientes a actividades AAM similares pero diferentes, la carga de trabajo del análisis manual involucrado aumentará considerablemente.
Sobre la base de tal problema, diseñamos un método de análisis de conglomerados iterativo, que realiza análisis de conglomerados de forma iterativa en múltiples rondas. En cada ronda, eliminaremos los paquetes de transacciones conocidos que contienen nuevas actividades MEV descubiertas en rondas anteriores y luego mejoraremos la fuerza de agrupación de los paquetes de transacciones restantes. No podemos utilizar directamente métodos de agrupación tradicionales para agrupar paquetes de transacciones, porque los paquetes de transacciones en realidad contienen múltiples transacciones y una transacción puede contener múltiples acciones DeFi. Si representamos el paquete de transacciones completo, su estructura es en realidad heterogénea y jerárquica. En este momento, utilizamos el método de aprendizaje de representación para representar el contenido del paquete de transacciones en un espacio de posicionamiento. La ventaja de utilizar el aprendizaje de representación es que no necesitamos realizar un aprendizaje y una comprensión profundos de los datos que queremos analizar y procesar, ni un rico conocimiento del dominio, solo necesitamos realizar un procesamiento simple orientado a datos.
Por ejemplo, solo necesitamos etiquetar el paquete de transacciones qué actividades MEV están incluidas en el paquete de transacciones. Si conocemos la definición de una actividad MEV, nos resulta más fácil diseñar las reglas correspondientes y detectar automáticamente si existe. Podemos etiquetar automáticamente estos paquetes de transacciones para representar el aprendizaje. Nuestro análisis de conglomerados es de tipo iterativo y, después de cada iteración, podemos descubrir nuevas actividades MEV. En este momento, podemos enriquecer las etiquetas correspondientes a estas actividades MEV recién descubiertas en nuestro proceso de aprendizaje de representación. Cuando se enriquecen las etiquetas utilizadas en nuestro proceso de aprendizaje de representación, el rendimiento y la eficiencia de todo el entrenamiento del modelo de aprendizaje de representación se pueden mejorar de forma iterativa, y este aprendizaje de representación puede mejorar de forma iterativa la capacidad de representación de actividades del paquete de transacciones. De hecho, puede haber múltiples transacciones en un paquete de transacciones y puede haber múltiples acciones DeFi en una transacción. Necesitamos expresar el paquete de transacciones. En primer lugar, para cada tipo de acción DeFi, definimos un parámetro estandarizado, como qué contrato está operando y luego cuál es la cantidad y el tipo de activos recibidos y transferidos. Definimos cada acción DeFi de esta manera. Si reconocemos que hay múltiples acciones DeFi en una transacción, las representamos con bloques de acción, de modo que se pueda representar el bloque de transacción correspondiente a la transacción, incluida la información fuente de la transacción, como quién inició la transacción y el dirección ¿A quién se envía? Cuando ocurre una acción DeFi en una transacción, la llenaremos con bloques de acción en orden. Cada transacción está representada por un bloque de transacciones y finalmente obtenemos la estructura del paquete de transacciones, que puede considerarse como una matriz. Una vez representado este paquete de transacciones, podemos usarlo para el aprendizaje de representación. Cada paquete de transacciones es una estructura unificada y luego podemos usar el modelo para el procesamiento por lotes.
Evaluación del desempeño
A continuación, compartimos los métodos que utilizamos para evaluar el rendimiento del flujo de trabajo. El conjunto de datos para todo nuestro proceso de análisis se realiza a través de la API proporcionada por Flashbots, y se recopilan los datos del paquete de transacciones desde febrero de 2021 hasta diciembre de 2022, incluidos más de 6 millones de paquetes de transacciones y 26 millones de transacciones.
Hemos diseñado algunas herramientas para comparar la precisión e integridad de las acciones DeFi. Cabe señalar aquí que entre estas herramientas en cadena, actualmente solo Etherscan puede recuperar la acción DeFi en la transacción a través de su página web y la información que proporciona. Y al igual que DeFiRanger, reproducimos sus métodos basándonos en sus artículos. Además, diseñamos una herramienta llamada EventLifter para intentar recuperar acciones DeFi directamente de eventos de transacciones. Probamos ActLifter en diferentes configuraciones y utilizamos varias herramientas para comparar la precisión del reconocimiento. Para ActCluster, nuestra idea principal es utilizar el aprendizaje por ablación. Para las nuevas actividades que podemos identificar, después de realizar la ablación de algunos módulos de ActCluster, si aún queremos identificar algunas actividades nuevas que no se han descubierto, ¿cuánto análisis manual necesitamos? ¿Qué tamaño tiene el paquete de transacciones o la carga de trabajo de nuestro análisis manual? Por ejemplo, hicimos una ablación de la actualización de la etiqueta dinámica en el módulo de aprendizaje de representación de ActCluster y, de hecho, eliminamos todo el proceso. Tomamos una muestra aleatoria de 6 millones de paquetes de transacciones y vemos cuántos paquetes de transacciones tenemos que analizar manualmente para descubrir la misma cantidad de nueva actividad MEV.
Nuestras herramientas pueden alcanzar cerca del 100% de precisión e integridad cuando se configuran de manera uniforme. Pero al igual que otras herramientas como Etherscan, aunque su precisión puede alcanzar el 100%, lo cual es bastante satisfactorio, pasará por alto muchas acciones de DeFi. Etherscan en sí no tiene un método de código abierto. Especulamos que puede utilizar el análisis manual para resumir reglas para identificar acciones DeFi. En consecuencia, omitirá algunos tipos que no se pueden cubrir manualmente. Cabe señalar aquí que Etherscan en realidad no proporciona una interfaz automatizada. Si desea realizar una identificación a gran escala, no puede completar dicha tarea directamente. La precisión e integridad de DeFiRanger, que está completamente identificado por reglas ocultas, no es satisfactoria. Después de experimentar con ActCluster, descubrimos que a través de cuatro rondas de análisis iterativo, solo necesitamos analizar un total de 2000 paquetes de transacciones para encontrar 17 actividades MEV desconocidas. Después de eliminar algunos de estos módulos, es posible que necesitemos analizar manualmente hasta 170.000 paquetes de transacciones para identificar las 17 actividades MEV desconocidas que acabamos de mencionar.
Análisis empírico y aplicación.
¿Cuáles son las aplicaciones específicas de nuestro método para identificar tipos desconocidos de actividad MEV? Primero, si puede mejorar las medidas de mitigación de MEV actualmente existentes y ser capaz de defenderse contra algunas actividades de MEV. El segundo es utilizar los resultados del análisis para ver si podemos analizar de manera más completa el impacto de las actividades MEV en la ecología de la cadena de bloques, incluido el impacto en la bifurcación y la reorganización del bosque de bloques y la seguridad financiera de los usuarios.
Mencionamos anteriormente que los atacantes de la red MEV boost ejecutarán herramientas para obtener paquetes de transacciones de los usuarios y luego, finalmente, distribuirlos a los mineros y validadores que los conectan. Los retransmisores eliminarán los paquetes de transacciones que contienen actividades MEA de los paquetes de transacciones que reciben, de esta manera pueden reducir parte del impacto negativo de las actividades MEA en la cadena de bloques. La idea principal de este enlace es diseñar las reglas correspondientes a través de la definición de actividades MEV existentes para detectar si las actividades MEV están incluidas en el paquete de transacciones. Obviamente, estos retransmisores no pueden descartar algunos paquetes de transacciones que contienen actividades MEV desconocidas. Según nuestro flujo de trabajo, diseñamos una herramienta MEVHunter, que puede detectar los nuevos tipos de actividades MEV que detectamos en el paquete de transacciones.
Los resultados de la detección muestran que más de 1 millón de paquetes de transacciones contienen actividades MEV de arbitraje inverso, y el 30% de los otros 6 millones de paquetes de transacciones contienen tres actividades MEV conocidas. Para nuestras actividades MEV recientemente descubiertas, encontramos que casi la mitad de los paquetes de transacciones contenían solo estas nuevas actividades MEV. Si el repetidor usa la herramienta MEVHunter, puede ayudarlo a filtrar 3 millones de paquetes de transacciones que contienen actividades MEV y luego optar por eliminar estos paquetes de transacciones para reducir el impacto negativo de las actividades MEV en la cadena de bloques.
La segunda aplicación es que exploramos el impacto de las nuevas actividades MEV en las bifurcaciones y reorganizaciones de blockchain. Algunos estudios anteriores han informado que algunos mineros financieros se sentirán motivados por los beneficios de algunas actividades MEV, para bifurcar y reorganizar la cadena de bloques actual, llevar a cabo actividades MEV y disfrutar de los beneficios. Por ejemplo, cuando los ingresos de la actividad MEV de un bloque son 4 veces la recompensa del bloque, no menos del 10% de los mineros bifurcarán y reorganizarán el bloque.
Primero identificamos qué paquetes de transacciones contienen nuevas actividades MEV según la herramienta MEVHunter que acabamos de mencionar, y luego estimamos la intensidad correspondiente de estas actividades MEV a través de los ingresos de los mineros en estos paquetes de transacciones. Aquí hay un concepto que debe introducirse: en el mecanismo del paquete de transacciones, para garantizar que sus paquetes de transacciones de arbitraje se puedan cargar en la cadena, estos arbitrajistas generalmente comparten parte de los ingresos de las actividades MEV con los mineros, y luego el Los mineros finalmente elegirán el paquete de transacciones con mayores ingresos para subirlo a la cadena. Podemos utilizar estos ingresos para estimar uniformemente la actividad MEV en cada paquete de transacciones. Según nuestros resultados estadísticos, hay más de 900 bloques cuyos ingresos MEV son de cuatro a ocho veces la recompensa del bloque, y hay otro bloque cuya recompensa MEV es incluso más de 700 veces la recompensa del bloque. Utilizamos el marco de toma de decisiones de Markov para determinar la cantidad mínima de mineros que pueden ser motivados para realizar bifurcaciones y reorganizaciones de bloques dado un ingreso MEV. Finalmente descubrimos que hay más de 1000 bloques que pueden motivar a no menos del 10% de los mineros a realizar bifurcaciones y reorganizaciones de bloques. Para el bloque más grave, no menos de 6 de cada 10.000 mineros son responsables de bifurcar y reorganizar el bloque.
La tercera aplicación es explorar el impacto de las actividades MEV en la seguridad financiera de los usuarios de blockchain. De hecho, las actividades MEV pueden hacer que se extienda el tiempo de espera para que las transacciones de los usuarios de blockchain se carguen en la cadena en el grupo de transacciones o en la red P2P. Esta es también una de las principales amenazas a la seguridad financiera de los usuarios causada por las actividades MEV. Si las transacciones de los usuarios se retrasan en la cadena, los arbitrajistas pueden tener más tiempo para diseñar actividades MEV más complejas y rentables. La tercera aplicación es comparar el impacto de la actividad MEV en el tiempo de espera para que las transacciones de los usuarios finalmente se carguen en la cadena. El primer paso es cobrar el tiempo de espera de la transacción. Principalmente implementamos nodos en la red, luego registramos el momento en que la transacción se descubre por primera vez en la red, el momento en que la transacción finalmente se carga en la cadena y, finalmente, calculamos el tiempo que debe esperar. Usamos los tres cuartiles de los tiempos de espera de todas las transacciones en cada bloque para hacer estadísticas, de modo que podamos organizar los tiempos de espera de las transacciones en una serie de tiempo por bloque. Luego, la actividad MEV correspondiente en cada bloque también se caracteriza por los ingresos obtenidos por los mineros en cada bloque del paquete de transacciones que contiene la nueva actividad MEV. De esta manera, obtenemos múltiples series de tiempo. Evaluamos el impacto de la actividad MEV en el tiempo de negociación mediante la prueba de causalidad de Granger. La prueba de causalidad puede determinar si las fluctuaciones en una serie de tiempo conducen a fluctuaciones en otra serie de tiempo y en qué rango afecta o causa fluctuaciones en otras series de tiempo. Cuando la actividad MEV fluctúa, ¿hace que el tiempo de espera para las transacciones de los usuarios sea más largo y en cuántos bloques posteriores se sentirá el impacto?
Cuando el valor P de la prueba de causalidad es menor o igual a 0,5, significa que el tiempo de espera de la transacción en este bloque se ha extendido por la influencia de actividades MEV anteriores. Según los resultados del análisis, se puede encontrar que cuando ocurre actividad MEV, se extenderá el tiempo de espera del 50% de las transacciones en los dos bloques siguientes. Cuando se produzca actividad MEV, se ampliará el tiempo de espera para el 25% de las transacciones en los próximos 30 bloques. Los mineros o verificadores colocarán las transacciones con tarifas de gas relativamente bajas al final del bloque de encapsulación. Cuanto menor sea el gas de transacción del usuario, mayor será el rango afectado por las actividades MEV y el tiempo de espera se extenderá más.
En conclusión, primero compartimos cómo encontrar actividades MEV desconocidas a través del flujo de trabajo y el diseño detallado de dos módulos en el flujo de trabajo. Luego verificamos la efectividad del flujo de trabajo a través del análisis empírico y enumeramos tres aplicaciones. Hasta ahora, hemos descubierto 17 nuevas actividades MEV utilizando el flujo de trabajo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Desmitificando el tipo desconocido de MEV en el paquete de transacciones de Ethereum
Invitado: Zihao Li, estudiante de doctorado en la Universidad Politécnica de Hong Kong
Organizado por: Aididiao.eth, Foresight News
Este artículo es un resumen del vídeo compartido por Zihao Li, estudiante de doctorado de la Universidad Politécnica de Hong Kong en el Programa Web3 Young Scholars. El programa Web3 Young Scholars, lanzado conjuntamente por DRK Lab, imToken y Crytape, invitará a jóvenes académicos de renombre en el campo del cifrado a compartir algunos de los últimos resultados de las investigaciones con la comunidad china.
Hola a todos, soy Zihao Li, estudiante de doctorado de tercer año en la Universidad Politécnica de Hong Kong. El tema que compartiré hoy es "Revelar las actividades MEV en el paquete de transacciones Ethereum". En pocas palabras, se trata de cómo descubrir tipos desconocidos de actividades MEV en la red Ethereum a través de paquetes de transacciones. Primero, daré una introducción de antecedentes relativamente básica, como el concepto de MEV, el mecanismo del paquete de transacciones y los antecedentes de nuestro trabajo. Luego, presentaré el flujo de trabajo completo y algunas ideas de diseño en detalle, como en qué principios de diseño está diseñado el flujo de trabajo; cuáles son nuestros conjuntos de datos; qué herramientas utilizamos para evaluar nuestro flujo de trabajo y en qué indicadores, etc. Finalmente, presentaré tres aplicaciones que incluyen resultados de análisis empíricos relevantes.
Introducción a los antecedentes: MEV, paquete de transacciones, motivación
La actividad MEV significa que los arbitrajistas en la cadena de bloques generan transacciones de arbitraje monitoreando la red de la cadena de bloques, incluido el estado del bloque. Parte de la información de las transacciones se difunde en la red blockchain P2P, o algunas transacciones que no se han subido formalmente a la cadena se almacenan en el grupo de transacciones de mineros o verificadores. Cuando el arbitrajista monitorea esta información de transacciones, genera la suya propia a través de algunas estrategias. La transacción de arbitraje, y luego especifica la transacción de arbitraje en una determinada posición en el siguiente bloque, por ejemplo, quiere estar a la cabeza del siguiente bloque, o en otras palabras, ejecutar una transacción estratégica inmediatamente después de una determinada transacción para difundir el mismo comercio de arbitraje. De esta forma, para especificar actividades de arbitraje en una determinada ubicación, podemos considerarlas como actividades MEV. Por ejemplo, si un arbitrajista monitorea las fluctuaciones de los precios de los activos, puede comprar el activo correspondiente en un grupo de negociación con un precio bajo y luego venderlo a un precio alto en otro grupo con un precio alto, lo que se considera una actividad MEV.
En la actualidad, las actividades de MEA las llevan a cabo principalmente arbitrajistas en torno a la ecología DeFi, porque la ecología DeFi actualmente reúne principalmente activos. Hasta ahora, la ecología DeFi de Ethereum, incluidas otras cadenas, ha atraído más de 40 mil millones de dólares estadounidenses en capital. Aquí debemos mencionar un concepto sobre la ecología DeFi, llamado acción DeFi, que corresponde a la operación del servicio atómico proporcionado por una aplicación DeFi. Por ejemplo, sabemos que AMM admite el intercambio entre diferentes tipos de activos. Los usuarios pueden vender un USDC. y luego obtener una cantidad de ETH. Dicha operación se puede definir como una acción DeFi. Podemos utilizar la acción DeFi para expresar las actividades MEV. Por ejemplo, si un usuario detecta que hay una brecha en los precios de los activos en diferentes AMM, el usuario puede comprar barato y vender caro, y finalmente obtener la ganancia por diferencia de precio. Podemos expresar esta actividad MEV como dos acciones DeFi.
En la actualidad, la investigación académica sobre las actividades MEV se divide principalmente en tres categorías, a saber, ataques sándwich, arbitraje inverso y liquidación. En el conjunto de datos con el que trabajamos, encontramos que estos tres tipos de actividades MEV aparecen más de 1 millón de veces. En realidad, hay una pregunta aquí: después de conocer las definiciones de estas actividades MEV, ¿cómo identificar la ocurrencia de actividades? Si queremos identificar estas actividades MEV, necesitamos identificar todas las actividades del arbitrajista, como qué transacciones genera el arbitrajista y qué tipos de arbitraje se incluyen en estas transacciones. Luego podemos determinar qué tipo de actividad MEV está ocurriendo actualmente. ., y todo el proceso depende en gran medida de nuestra definición de actividad MEV conocida. Tome un ataque sándwich como ejemplo. Después de conocer la definición de un ataque sándwich, si queremos determinar el valor de arbitraje del ataque sándwich y sus transacciones de arbitraje correspondientes, debemos establecer muchas reglas basadas en la definición. y luego filtrar los ataques sándwich candidatos a través de estas reglas, valor de arbitraje y comercio. Al identificar de esta manera los tipos de ataques MEV conocidos, surgen dos preguntas: la primera es si las tres actividades MEV comunes que conocemos pueden representar todas las actividades MEV. Obviamente no, porque el ecosistema DeFi siempre está en desarrollo, siempre se están desarrollando nuevas aplicaciones y las estrategias de estos arbitrajistas en realidad se iteran constantemente. La segunda pregunta es cómo podemos descubrir estas actividades MEV desconocidas. Con esta pregunta en mente, echemos un vistazo al mecanismo del paquete de transacciones.
El mecanismo del paquete de transacciones se propuso por primera vez en 2021. En pocas palabras, los usuarios pueden organizar una cola de transacciones. La longitud de esta cola de transacciones puede ser una transacción o varias transacciones, y luego el usuario envía estas transacciones a la red blockchain. El retransmisor las recopila. transacciones y las envía directa y privadamente a los mineros o verificadores relevantes. Actualmente, los retransmisores ejecutarán paquetes de transacciones para realizar tareas de retransmisión. El mecanismo del paquete de transacciones tiene una característica muy importante: cuando estos usuarios construyen un paquete de transacciones, pueden colocar las transacciones de otras personas que no se han cargado en la cadena en un paquete de transacciones, y el orden de las transacciones en el paquete de transacciones se puede manipular arbitrariamente. . En este momento, el usuario del paquete comercial o el arbitrajista que utiliza el paquete comercial puede diseñar sus reglas de arbitraje. Por ejemplo, puede diseñar una estrategia más compleja y rentable para las actividades de MEV. Tomando el ataque sándwich como ejemplo, si no se utiliza ningún paquete de transacciones, un arbitrajista en un ataque sándwich necesita generar al menos un par de transacciones para lograr el arbitraje, y este par de transacciones de arbitraje solo puede apuntar a esta transacción. El arbitraje generado por esta transacción de ataque debe ejecutarse en un orden determinado para garantizar que se pueda arbitrar con éxito. Pero si un arbitrajista utiliza un paquete comercial, puede recopilar muchas transacciones que pueden ser arbitradas. Sólo necesita utilizar un par de transacciones de arbitraje correspondientes para generar arbitraje en múltiples transacciones al mismo tiempo. Mientras este paquete de transacciones esté en la cadena, definitivamente tendrá éxito en el arbitraje y, debido a que arbitra múltiples transacciones arbitrables al mismo tiempo, sus resultados de arbitraje también son más rentables.
El paquete comercial se caracteriza por actividades MEV muy ricas y complejas. Porque los usuarios que usan paquetes de transacciones encapsulan sus transacciones completas en el paquete de transacciones, luego las envían al retransmisor de la red P2P y finalmente a los mineros y verificadores correspondientes. Podemos identificar de forma precisa y completa todas las actividades a través de paquetes de transacciones. Por lo tanto, podemos identificar con mayor precisión algunas actividades MEV desconocidas a través del medio del paquete de transacciones.
Flujo de trabajo e ideas de diseño
A continuación, presentemos nuestro flujo de trabajo en detalle. ¿Cómo descubrimos actividades MEV desconocidas a través de un medio como un paquete de transacciones? El flujo de trabajo principal incluye dos herramientas. Primero, después de que el retransmisor recopila el paquete de transacciones, utilizamos la herramienta ActLifter para identificar cada acción DeFi en el paquete de transacciones. Después de obtener los resultados, representamos todas las acciones en el paquete de transacciones. . Luego use la herramienta ActCluster para agrupar paquetes de transacciones con actividades similares y descubra nuevas actividades MEV más rápido a través de los resultados de la agrupación. Si queremos descubrir actividades MEV desconocidas, inevitablemente necesitamos confirmar manualmente si la actividad MEV es de un tipo desconocido. Por supuesto, nuestro objetivo de diseño de trabajo es minimizar la carga de trabajo manual tanto como sea posible y hacer que todo el proceso sea lo más eficiente posible. posible Realizar automáticamente.
Ya existen herramientas que pueden identificar la actividad MEV a partir de transacciones. Podemos dividirlo aproximadamente en dos categorías: la primera categoría son reglas de resumen puramente manuales y la segunda categoría son reglas puramente heurísticas, es decir, el uso de una regla heurística puramente automatizada para identificar tipos específicos de actividades MEV. Por ejemplo, después de identificar cierta información de transferencia actual, verifica si se cumplen las reglas heurísticas y, de ser así, puede identificar la actividad correspondiente. El primer método de resumen de reglas puramente manual puede lograr una precisión relativamente buena, porque este proceso es un análisis completamente manual de aplicaciones específicas y luego puede garantizar que los resultados de la detección sean precisos, pero la tarea de análisis requiere una carga de trabajo muy grande, por lo que no puede cubrir todas las aplicaciones DeFi. Aunque el segundo trabajo puede ser puramente automatizado, las reglas heurísticas sólo pueden cubrir algunos tipos específicos. Por otro lado, existen algunos problemas en el diseño de las reglas heurísticas, lo que da como resultado una precisión de reconocimiento insatisfactoria.
Diseñamos nuestro flujo de trabajo combinando las ventajas de ambos métodos. Podemos identificar diez acciones DeFi importantes actualmente. Solo necesitamos determinar manualmente qué evento en la aplicación DeFi corresponde a qué tipo de acción DeFi después de iniciarse, entonces no necesitamos un análisis manual y podemos dejarlo completamente en manos del análisis automatizado. El segundo tipo de método puede identificar de forma completamente automática las acciones DeFi, pero no puede determinar si el objeto analizado está relacionado con actividades MEV. Por ejemplo, si identificamos una transferencia SWAP, es posible que identifique dos combinaciones de transferencias completamente independientes como una acción DeFi y, naturalmente, el resultado de su identificación será incorrecto. Pero podemos utilizar esta información para filtrar información que esté realmente relacionada con las acciones de DeFi. Luego de obtener esta información, podemos evitar algunos errores como los que ocurren en el segundo tipo de método mediante métodos automatizados.
Por ejemplo, aquí hay una transacción que involucra cuatro transferencias en total, y su orden de ocurrencia, cantidad de fondos y tipo están marcados con números de serie. En este proceso, AMM en realidad inicia un evento relacionado con la acción de intercambio. Una vez que el primer método determina que se inició el evento, necesita restaurar el contenido actual a través de algunos parámetros del evento. Por ejemplo, necesita observar el código, la lógica empresarial y algunas variables de función del contrato 699 para restaurar el contenido actual. Después de obtener esta información, diseñamos una regla basada en sus características únicas de transferencia de activos. Por ejemplo, la regla que refinamos es que el contrato que actualmente opera DeFi recibe y transfiere diferentes tipos de activos. Cuando encontramos que hay dos transacciones como esta Una vez que la transferencia de activos se ajuste a dichas características, podemos restaurar el contenido de la acción de intercambio correspondiente. El segundo tipo de método consiste en hacer coincidir directamente dos transferencias de activos: las dos cuentas de transferencia de activos recibieron y transfirieron diferentes tipos de activos. La primera y quinta transferencia se considerarán como un par de transferencias relacionadas, y la cuenta del medio se considerará AMM. Obviamente, podemos ver intuitivamente que el resultado de la identificación es inexacto.
Las reglas que resumimos a través del análisis manual son los tipos de acciones DeFi correspondientes a eventos relevantes. Aunque los resultados se resumen a través del análisis manual, todavía intentamos refinar el proceso de análisis manual en un proceso semiautomático para garantizar la confiabilidad de todo nuestro proceso. Consultaremos el sitio web oficial y la documentación para desarrolladores de aplicaciones DeFi, incluidos algunos códigos fuente de contratos, en los sitios web oficiales de DeFiPulse.com y Dapp.com. Desarrollamos herramientas de análisis que pueden extraer algunas descripciones de eventos en documentos de estos materiales involucrados, como cómo se define este evento con tokens y en qué funciones, fragmentos de código y comentarios de código donde se utilizan estos eventos. Después de extraer estas cosas, a través de nuestro análisis y discusión manual, finalmente determinamos que hay 88 eventos correspondientes a diferentes tipos de acciones DeFi.
Ingresamos la transacción a analizar en este diccionario y analizamos qué eventos ocurrieron en la transacción. Luego, cuando aparece un evento en este diccionario, extraemos información clave de acuerdo con las reglas correspondientes, como qué contrato opera esta acción DeFi, cuál es el tipo de esta DeFi y qué transferencias de activos están relacionadas con esta acción DeFi. Después de obtener dicho contenido, resumiremos las reglas características de la transferencia de activos y luego usaremos estas reglas para que coincidan con la acción final de DeFi. Partimos de la definición de diez acciones DeFi y resumimos las reglas características de la transferencia de activos. Después de recopilar esta información en el paso anterior, usaremos estas reglas de coincidencia y finalmente nos ayudarán a identificar qué contenido específico ocurrió en qué DeFi en esta transacción. Después de que ActCluster identifique cada transacción en el paquete de transacciones, podemos expresar el comportamiento del paquete de transacciones.
Primero comprendamos los principios de diseño de ActCluster. Sabemos que el análisis manual es inevitable en este proceso y debe depender del trabajo manual para determinar si la actividad del paquete de transacciones es un tipo desconocido de actividad MEV. En base a esto, nuestra idea básica es agrupar transacciones con actividades similares. Para cada grupo, solo necesitamos muestrear aleatoriamente uno o varios paquetes de transacciones para su análisis, lo que puede acelerar el proceso de análisis manual y, en última instancia, descubrir diferentes tipos de actividades MEA. Cuando utilizamos el análisis de conglomerados para agrupar paquetes de transacciones, nos enfrentamos a un dilema. Cuando establecemos la fuerza de agrupación de los paquetes de transacciones de manera relativamente aproximada, los paquetes de transacciones que contienen diferentes tipos de actividades se agruparán. En este momento, aunque el número de grupos se reducirá, las tareas de análisis manual correspondientes también se reducirán. Menos, pero Hay algunos eventos MEV nuevos que nos perderemos. Si ajustamos la intensidad de la agrupación para que sea más detallada, aunque podemos distinguir algunos paquetes de transacciones correspondientes a actividades AAM similares pero diferentes, la carga de trabajo del análisis manual involucrado aumentará considerablemente.
Sobre la base de tal problema, diseñamos un método de análisis de conglomerados iterativo, que realiza análisis de conglomerados de forma iterativa en múltiples rondas. En cada ronda, eliminaremos los paquetes de transacciones conocidos que contienen nuevas actividades MEV descubiertas en rondas anteriores y luego mejoraremos la fuerza de agrupación de los paquetes de transacciones restantes. No podemos utilizar directamente métodos de agrupación tradicionales para agrupar paquetes de transacciones, porque los paquetes de transacciones en realidad contienen múltiples transacciones y una transacción puede contener múltiples acciones DeFi. Si representamos el paquete de transacciones completo, su estructura es en realidad heterogénea y jerárquica. En este momento, utilizamos el método de aprendizaje de representación para representar el contenido del paquete de transacciones en un espacio de posicionamiento. La ventaja de utilizar el aprendizaje de representación es que no necesitamos realizar un aprendizaje y una comprensión profundos de los datos que queremos analizar y procesar, ni un rico conocimiento del dominio, solo necesitamos realizar un procesamiento simple orientado a datos.
Por ejemplo, solo necesitamos etiquetar el paquete de transacciones qué actividades MEV están incluidas en el paquete de transacciones. Si conocemos la definición de una actividad MEV, nos resulta más fácil diseñar las reglas correspondientes y detectar automáticamente si existe. Podemos etiquetar automáticamente estos paquetes de transacciones para representar el aprendizaje. Nuestro análisis de conglomerados es de tipo iterativo y, después de cada iteración, podemos descubrir nuevas actividades MEV. En este momento, podemos enriquecer las etiquetas correspondientes a estas actividades MEV recién descubiertas en nuestro proceso de aprendizaje de representación. Cuando se enriquecen las etiquetas utilizadas en nuestro proceso de aprendizaje de representación, el rendimiento y la eficiencia de todo el entrenamiento del modelo de aprendizaje de representación se pueden mejorar de forma iterativa, y este aprendizaje de representación puede mejorar de forma iterativa la capacidad de representación de actividades del paquete de transacciones. De hecho, puede haber múltiples transacciones en un paquete de transacciones y puede haber múltiples acciones DeFi en una transacción. Necesitamos expresar el paquete de transacciones. En primer lugar, para cada tipo de acción DeFi, definimos un parámetro estandarizado, como qué contrato está operando y luego cuál es la cantidad y el tipo de activos recibidos y transferidos. Definimos cada acción DeFi de esta manera. Si reconocemos que hay múltiples acciones DeFi en una transacción, las representamos con bloques de acción, de modo que se pueda representar el bloque de transacción correspondiente a la transacción, incluida la información fuente de la transacción, como quién inició la transacción y el dirección ¿A quién se envía? Cuando ocurre una acción DeFi en una transacción, la llenaremos con bloques de acción en orden. Cada transacción está representada por un bloque de transacciones y finalmente obtenemos la estructura del paquete de transacciones, que puede considerarse como una matriz. Una vez representado este paquete de transacciones, podemos usarlo para el aprendizaje de representación. Cada paquete de transacciones es una estructura unificada y luego podemos usar el modelo para el procesamiento por lotes.
Evaluación del desempeño
A continuación, compartimos los métodos que utilizamos para evaluar el rendimiento del flujo de trabajo. El conjunto de datos para todo nuestro proceso de análisis se realiza a través de la API proporcionada por Flashbots, y se recopilan los datos del paquete de transacciones desde febrero de 2021 hasta diciembre de 2022, incluidos más de 6 millones de paquetes de transacciones y 26 millones de transacciones.
Hemos diseñado algunas herramientas para comparar la precisión e integridad de las acciones DeFi. Cabe señalar aquí que entre estas herramientas en cadena, actualmente solo Etherscan puede recuperar la acción DeFi en la transacción a través de su página web y la información que proporciona. Y al igual que DeFiRanger, reproducimos sus métodos basándonos en sus artículos. Además, diseñamos una herramienta llamada EventLifter para intentar recuperar acciones DeFi directamente de eventos de transacciones. Probamos ActLifter en diferentes configuraciones y utilizamos varias herramientas para comparar la precisión del reconocimiento. Para ActCluster, nuestra idea principal es utilizar el aprendizaje por ablación. Para las nuevas actividades que podemos identificar, después de realizar la ablación de algunos módulos de ActCluster, si aún queremos identificar algunas actividades nuevas que no se han descubierto, ¿cuánto análisis manual necesitamos? ¿Qué tamaño tiene el paquete de transacciones o la carga de trabajo de nuestro análisis manual? Por ejemplo, hicimos una ablación de la actualización de la etiqueta dinámica en el módulo de aprendizaje de representación de ActCluster y, de hecho, eliminamos todo el proceso. Tomamos una muestra aleatoria de 6 millones de paquetes de transacciones y vemos cuántos paquetes de transacciones tenemos que analizar manualmente para descubrir la misma cantidad de nueva actividad MEV.
Nuestras herramientas pueden alcanzar cerca del 100% de precisión e integridad cuando se configuran de manera uniforme. Pero al igual que otras herramientas como Etherscan, aunque su precisión puede alcanzar el 100%, lo cual es bastante satisfactorio, pasará por alto muchas acciones de DeFi. Etherscan en sí no tiene un método de código abierto. Especulamos que puede utilizar el análisis manual para resumir reglas para identificar acciones DeFi. En consecuencia, omitirá algunos tipos que no se pueden cubrir manualmente. Cabe señalar aquí que Etherscan en realidad no proporciona una interfaz automatizada. Si desea realizar una identificación a gran escala, no puede completar dicha tarea directamente. La precisión e integridad de DeFiRanger, que está completamente identificado por reglas ocultas, no es satisfactoria. Después de experimentar con ActCluster, descubrimos que a través de cuatro rondas de análisis iterativo, solo necesitamos analizar un total de 2000 paquetes de transacciones para encontrar 17 actividades MEV desconocidas. Después de eliminar algunos de estos módulos, es posible que necesitemos analizar manualmente hasta 170.000 paquetes de transacciones para identificar las 17 actividades MEV desconocidas que acabamos de mencionar.
Análisis empírico y aplicación.
¿Cuáles son las aplicaciones específicas de nuestro método para identificar tipos desconocidos de actividad MEV? Primero, si puede mejorar las medidas de mitigación de MEV actualmente existentes y ser capaz de defenderse contra algunas actividades de MEV. El segundo es utilizar los resultados del análisis para ver si podemos analizar de manera más completa el impacto de las actividades MEV en la ecología de la cadena de bloques, incluido el impacto en la bifurcación y la reorganización del bosque de bloques y la seguridad financiera de los usuarios.
Mencionamos anteriormente que los atacantes de la red MEV boost ejecutarán herramientas para obtener paquetes de transacciones de los usuarios y luego, finalmente, distribuirlos a los mineros y validadores que los conectan. Los retransmisores eliminarán los paquetes de transacciones que contienen actividades MEA de los paquetes de transacciones que reciben, de esta manera pueden reducir parte del impacto negativo de las actividades MEA en la cadena de bloques. La idea principal de este enlace es diseñar las reglas correspondientes a través de la definición de actividades MEV existentes para detectar si las actividades MEV están incluidas en el paquete de transacciones. Obviamente, estos retransmisores no pueden descartar algunos paquetes de transacciones que contienen actividades MEV desconocidas. Según nuestro flujo de trabajo, diseñamos una herramienta MEVHunter, que puede detectar los nuevos tipos de actividades MEV que detectamos en el paquete de transacciones.
Los resultados de la detección muestran que más de 1 millón de paquetes de transacciones contienen actividades MEV de arbitraje inverso, y el 30% de los otros 6 millones de paquetes de transacciones contienen tres actividades MEV conocidas. Para nuestras actividades MEV recientemente descubiertas, encontramos que casi la mitad de los paquetes de transacciones contenían solo estas nuevas actividades MEV. Si el repetidor usa la herramienta MEVHunter, puede ayudarlo a filtrar 3 millones de paquetes de transacciones que contienen actividades MEV y luego optar por eliminar estos paquetes de transacciones para reducir el impacto negativo de las actividades MEV en la cadena de bloques.
La segunda aplicación es que exploramos el impacto de las nuevas actividades MEV en las bifurcaciones y reorganizaciones de blockchain. Algunos estudios anteriores han informado que algunos mineros financieros se sentirán motivados por los beneficios de algunas actividades MEV, para bifurcar y reorganizar la cadena de bloques actual, llevar a cabo actividades MEV y disfrutar de los beneficios. Por ejemplo, cuando los ingresos de la actividad MEV de un bloque son 4 veces la recompensa del bloque, no menos del 10% de los mineros bifurcarán y reorganizarán el bloque.
Primero identificamos qué paquetes de transacciones contienen nuevas actividades MEV según la herramienta MEVHunter que acabamos de mencionar, y luego estimamos la intensidad correspondiente de estas actividades MEV a través de los ingresos de los mineros en estos paquetes de transacciones. Aquí hay un concepto que debe introducirse: en el mecanismo del paquete de transacciones, para garantizar que sus paquetes de transacciones de arbitraje se puedan cargar en la cadena, estos arbitrajistas generalmente comparten parte de los ingresos de las actividades MEV con los mineros, y luego el Los mineros finalmente elegirán el paquete de transacciones con mayores ingresos para subirlo a la cadena. Podemos utilizar estos ingresos para estimar uniformemente la actividad MEV en cada paquete de transacciones. Según nuestros resultados estadísticos, hay más de 900 bloques cuyos ingresos MEV son de cuatro a ocho veces la recompensa del bloque, y hay otro bloque cuya recompensa MEV es incluso más de 700 veces la recompensa del bloque. Utilizamos el marco de toma de decisiones de Markov para determinar la cantidad mínima de mineros que pueden ser motivados para realizar bifurcaciones y reorganizaciones de bloques dado un ingreso MEV. Finalmente descubrimos que hay más de 1000 bloques que pueden motivar a no menos del 10% de los mineros a realizar bifurcaciones y reorganizaciones de bloques. Para el bloque más grave, no menos de 6 de cada 10.000 mineros son responsables de bifurcar y reorganizar el bloque.
La tercera aplicación es explorar el impacto de las actividades MEV en la seguridad financiera de los usuarios de blockchain. De hecho, las actividades MEV pueden hacer que se extienda el tiempo de espera para que las transacciones de los usuarios de blockchain se carguen en la cadena en el grupo de transacciones o en la red P2P. Esta es también una de las principales amenazas a la seguridad financiera de los usuarios causada por las actividades MEV. Si las transacciones de los usuarios se retrasan en la cadena, los arbitrajistas pueden tener más tiempo para diseñar actividades MEV más complejas y rentables. La tercera aplicación es comparar el impacto de la actividad MEV en el tiempo de espera para que las transacciones de los usuarios finalmente se carguen en la cadena. El primer paso es cobrar el tiempo de espera de la transacción. Principalmente implementamos nodos en la red, luego registramos el momento en que la transacción se descubre por primera vez en la red, el momento en que la transacción finalmente se carga en la cadena y, finalmente, calculamos el tiempo que debe esperar. Usamos los tres cuartiles de los tiempos de espera de todas las transacciones en cada bloque para hacer estadísticas, de modo que podamos organizar los tiempos de espera de las transacciones en una serie de tiempo por bloque. Luego, la actividad MEV correspondiente en cada bloque también se caracteriza por los ingresos obtenidos por los mineros en cada bloque del paquete de transacciones que contiene la nueva actividad MEV. De esta manera, obtenemos múltiples series de tiempo. Evaluamos el impacto de la actividad MEV en el tiempo de negociación mediante la prueba de causalidad de Granger. La prueba de causalidad puede determinar si las fluctuaciones en una serie de tiempo conducen a fluctuaciones en otra serie de tiempo y en qué rango afecta o causa fluctuaciones en otras series de tiempo. Cuando la actividad MEV fluctúa, ¿hace que el tiempo de espera para las transacciones de los usuarios sea más largo y en cuántos bloques posteriores se sentirá el impacto?
Cuando el valor P de la prueba de causalidad es menor o igual a 0,5, significa que el tiempo de espera de la transacción en este bloque se ha extendido por la influencia de actividades MEV anteriores. Según los resultados del análisis, se puede encontrar que cuando ocurre actividad MEV, se extenderá el tiempo de espera del 50% de las transacciones en los dos bloques siguientes. Cuando se produzca actividad MEV, se ampliará el tiempo de espera para el 25% de las transacciones en los próximos 30 bloques. Los mineros o verificadores colocarán las transacciones con tarifas de gas relativamente bajas al final del bloque de encapsulación. Cuanto menor sea el gas de transacción del usuario, mayor será el rango afectado por las actividades MEV y el tiempo de espera se extenderá más.
En conclusión, primero compartimos cómo encontrar actividades MEV desconocidas a través del flujo de trabajo y el diseño detallado de dos módulos en el flujo de trabajo. Luego verificamos la efectividad del flujo de trabajo a través del análisis empírico y enumeramos tres aplicaciones. Hasta ahora, hemos descubierto 17 nuevas actividades MEV utilizando el flujo de trabajo.