DeepSeek-R1 Combina IA i Edge Computing per a la IoT industrial

Introducció

Els models destil·lats de mida petita de DeepSeek-R1 s'ajusten mitjançant dades de cadena de pensament generades per DeepSeek-R1, marcades amb...etiquetes, heretant les capacitats de raonament de R1. Aquests conjunts de dades ajustats inclouen explícitament processos de raonament com ara la descomposició de problemes i les deduccions intermèdies. L'aprenentatge per reforç ha alineat els patrons de comportament del model destil·lat amb els passos de raonament generats per R1. Aquest mecanisme de destil·lació permet que els models petits mantinguin l'eficiència computacional alhora que obtenen habilitats de raonament complexes properes a les dels models més grans, cosa que té un valor d'aplicació significatiu en escenaris amb recursos limitats. Per exemple, la versió 14B aconsegueix el 92% de la finalització de codi del model original DeepSeek-R1. Aquest article presenta el model destil·lat DeepSeek-R1 i les seves aplicacions principals en la computació industrial perimetral, resumides en les quatre direccions següents, juntament amb casos d'implementació específics:

dc3c637c5bead8b62ed51b6d83ac0b4

Manteniment predictiu d'equips

Implementació tècnica

Fusió de sensors:

Integra dades de vibració, temperatura i corrent dels PLC a través del protocol Modbus (freqüència de mostreig d'1 kHz).

Extracció de característiques:

Executeu Edge Impulse a Jetson Orin NX per extreure característiques de sèries temporals de 128 dimensions.

Inferència del model:

Implementeu el model DeepSeek-R1-Distill-14B, introduint vectors de característiques per generar valors de probabilitat de fallada.

Ajust dinàmic:

Activar ordres de treball de manteniment quan la confiança sigui > 85% i iniciar un procés de verificació secundària quan sigui < 60%.

Cas rellevant

Schneider Electric va implementar aquesta solució en maquinària minera, reduint les taxes de falsos positius en un 63% i els costos de manteniment en un 41%.

1

Execució del model destil·lat DeepSeek R1 en ordinadors InHand AI Edge

Inspecció visual millorada

Arquitectura de sortida

Canalització de desplegament típica:

càmera = GigE_Vision_Camera(500fps) # Càmera industrial Gigabit
frame = camera.capture() # Captura la imatge
preprocessat = OpenCV.denoise(frame) # Preprocessament amb eliminació de soroll
tipus_defecte = DeepSeek_R1_7B.infer(preprocessat) # Classificació de defectes
si tipus_defecte != 'normal':
PLC.trigger_reject() # Activa el mecanisme d'ordenació

Mètriques de rendiment

Retard de processament:

82 ms (Jetson AGX Orin)

Precisió:

La detecció de defectes de modelat per injecció arriba al 98,7%.

2

Implicacions de DeepSeek R1: guanyadors i perdedors en la cadena de valor de la IA generativa

Optimització del flux de processos

Tecnologies clau

Interacció en llenguatge natural:

Els operadors descriuen anomalies de l'equipament per veu (per exemple, "Fluctuació de la pressió de l'extrusora ±0,3 MPa").

Raonament multimodal:

El model genera suggeriments d'optimització basats en dades històriques de l'equip (per exemple, ajustar la velocitat del cargol en un 2,5%).

Verificació de bessons digitals:

Validació de la simulació de paràmetres a la plataforma EdgeX Foundry.

Efecte d'implementació

La planta química de BASF va adoptar aquest esquema, aconseguint una reducció del 17% en el consum d'energia i un augment del 9% en la taxa de qualitat del producte.

3

IA perifèrica i el futur dels negocis: OpenAI o1 vs. DeepSeek R1 per a la salut, l'automoció i l'IIoT

Recuperació instantània de la base de coneixements

Disseny d'arquitectura

Base de dades de vectors locals:

Feu servir ChromaDB per emmagatzemar manuals d'equips i especificacions de processos (incrustant la dimensió 768).

Recuperació híbrida:

Combina l'algoritme BM25 + la similitud del cosinus per a la consulta.

Generació de resultats:

El model R1-7B resumeix i refina els resultats de recuperació.

Cas típic

Els enginyers de Siemens van resoldre les avaries de l'inversor mitjançant consultes en llenguatge natural, reduint el temps mitjà de processament en un 58%.

Reptes i solucions de desplegament

Limitacions de memòria:

S'ha utilitzat la tecnologia de quantificació de la memòria cau KV, reduint l'ús de memòria del model 14B de 32 GB a 9 GB.

Garantir el rendiment en temps real:

Latència d'inferència única estabilitzada a ±15 ms mitjançant l'optimització de gràfics CUDA.

Deriva del model:

Actualitzacions incrementals setmanals (transmetent només el 2% dels paràmetres).

Ambients extrems:

Dissenyat per a amplis rangs de temperatura de -40 °C a 85 °C amb nivell de protecció IP67.

5
微信图片_20240614024031.jpg1

Conclusió

Els costos de desplegament actuals han disminuït a 599 dòlars/node (Jetson Orin NX), amb aplicacions escalables que s'estan formant en sectors com la fabricació 3C, el muntatge d'automòbils i la química energètica. Es preveu que l'optimització contínua de l'arquitectura MoE i la tecnologia de quantificació permetran que el model 70B s'executi en dispositius perimetrals a finals del 2025.

Troba una solució de cable ELV

Cables de control

Per a BMS, BUS, industrial, cable d'instrumentació.

Sistema de cablejat estructurat

Xarxa i dades, cable de fibra òptica, cable de connexió, mòduls, placa frontal

Revisió d'exposicions i esdeveniments 2024

16-18 d'abril de 2024. Fira d'energia de l'Orient Mitjà a Dubai

16-18 d'abril de 2024 Securika a Moscou

9 de maig de 2024 ESDEVENIMENT DE LLANÇAMENT DE NOUS PRODUCTES I TECNOLOGIES a Xangai

22-25 d'octubre de 2024 SECURITY CHINA a Pequín

19-20 de novembre de 2024 CONNECTED WORLD KSA


Data de publicació: 07-02-2025