Machine-learning is werkelijkheid geworden – Gebruik het verstandig
Machine-learning (ML), een subgroep van kunstmatige intelligentie (Artificial Intelligence - AI), wordt reeds gebruikt in toepassingen als medische diagnose, beeldverwerking, classificatie, voorspelling, regressietesten en nog veel meer. Bij de overweging van het gebruik van ML, zijn er over het algemeen twee risicogebieden: de veiligheid van het gebruik ervan en de aantasting van de geldigheid van de bevindingen.
Afbeelding 1: het Industrial Internet of Things (IIoT) kent vele interconnecties die efficiënter kunnen worden beheerd door machine-learning in het systeem in te bouwen. (Bron afbeelding: SlideShare.net)
Aanvallen op de veiligheid van AI zijn niet nieuw, maar worden wel steeds vernuftiger. Hierbij kan gebruik worden gemaakt van het aanvalsoppervlak, oftewel het aantal punten waar een onbevoegde gebruiker heimelijk gegevens kan invoeren of extraheren. Er zijn drie gebieden die risicogevoelig zijn: invoergegevens, algoritmeontwerp en uitvoerbeslissingen.
Machine-learning kan het beste worden verkregen via toegang tot enorme hoeveelheden gegevens, van waaruit het systeem dingen kan aanleren op een niveau dat voor mensen moeilijk te bereiken is. Bij aanvallen wordt gebruik gemaakt van getrainde modellen die schade aanrichten dankzij het aanmaken van “achterdeuren" en het invoeren van kwaadaardige payload of trigger. In dit segment van AI zijn de algoritmes complex en onvoorspelbaar, niet onderworpen aan normen en voorschriften en gebaseerd op propriëtaire gegevens, waardoor manipulatie nog moeilijker te detecteren is.
En naast de beveiliging is er nog een ander risico. Aangezien machine-learning modellen door mensen worden gecreëerd, zijn ze onderhevig aan vertekening die in het model kan zijn ingebouwd. Gegevensvertekening, oftewel bias, is gevaarlijk en dient zorgvuldig te worden beheerd. Het beheren van bias is een zeer belangrijk aspect bij het beheer van risico's in samenhang met machine-learning.
Risico hangt ook samen met onvoldoende gegevens en het bestaan van goede of geschikte gegevens. Het gebrek aan variabele gegevens met voldoende gegevenspunten om de beste invoer te vinden voor optimale uitvoer kan een groot probleem zijn. De gegevens waarop modellen voor machine-learning gebaseerd zijn, moeten variatie tussen gegevenstypen, tijdframes en andere vormen van variabiliteit kennen.
Tot slot is er het punt van de uitvoerinterpretatie. Het is mogelijk dat uitvoer verkeerd wordt geïnterpreteerd.Modellen bieden schattingen en richtlijnen, maar om interpretaties waardevol te maken is het belangrijk om te kijken naar hoe een model werd gebouwd, welke veronderstellingen werden gedaan en wat de uitvoer je vertelt.
We kennen al veel gevallen van dingen die mis kunnen gaan, bijvoorbeeld:
- Algoritmes kregen de schuld van het feit dat het Britse pond in twee minuten met 6% daalde tijdens het Brexit-referendum in 2016.
- Algoritmes die worden gebruikt door strafrechtsystemen in de Verenigde Staten om recidivepercentages te voorspellen, vertonen racistische vertekeningen.
- Veel resultaten van hersenstudies moeten in twijfel worden getrokken nu er onjuiste statistische veronderstellingen en bugs zijn gevonden in functionele magnetische resonantiebeeldvorming (fMRI).
- Toen de Bitcoin-prijzen in 2017 snel stegen, konden hackers gratis met Google-Cloudinstanties werken. Het systeem voor detectie van afwijkingen van Google Cloud was in gebruik voor Google-Cloudinstanties dus de clients werden gewaarschuwd voor de aantasting.
Machine-learning systemen lossen moeilijke problemen op. Het feit dat dit op beveiligings- en nauwkeurigheidsniveau een negatieve impact kan hebben, zal worden beïnvloed door vooruitgang in de gebruikte technologie en de toename van succesvolle toepassingen die gebruik maken van ML.
Recente stappen vooruit op het gebied van machine-learning
STMicroelectronics heeft onlangs haar eerste machine-learning toepassing aangekondigd op de STM32G4 van partner Cartesiam, lid van het Machine Learning ST-partnerprogramma. ST lanceerde STM32Cube.AI zodat ontwikkelaars gemakkelijk een neuraal netwerk kunnen trainen door gegevens te verzamelen alvorens het in een neuraal netwerktraining-framework op een pc te verwerken om specifieke activiteiten te herkennen, zoals wandelen, hardlopen of zwemmen. De uitvoer wordt vervolgens omgezet naar een code die STM32 MCU's in staat stelt om de activiteiten te herkennen.
Afbeelding 2: weergegeven is het SensorTile-evaluatiebord van STMicroelectronics. (Bron afbeelding: STMicroelectronics)
De NanoEdge AI van Cartesiam voert de leerfase op de microcontroller uit. Ingenieurs nemen hun toevlucht tot deze oplossing wanneer ze geen netjes vooraf getrainde modellen kunnen maken voor specifieke situaties, maar toch machine-learning willen gebruiken om intelligente systemen te bouwen. De trainingsfase wordt uitgevoerd op de MCU om het normale gedrag van een apparaat binnen zijn beoogde omgeving te leren, vervolgens worden op dezelfde MCU interferenties uitgevoerd om gedragsafwijkingen te detecteren en te rapporteren.
Met NanoEdge AI kunnen ontwikkelaars lokale AI-training en -analysefuncties gemakkelijk integreren in C-code, geoptimaliseerd voor STM32 MCU's. Tijdens demonstraties liet Cartesiam zie hoe machine-learning bibliotheken de SensorTile-module, het SensorTile-evaluatiebord (Afbeelding 2) van STM konden gebruiken om het gedrag van een BLDC-motor te leren via trillingsanalyse en vervolgens een afwijking konden detecteren en rapporteren dankzij de ingebedde STM32L4 MCU.
Ook op de geavanceerde sensors van STMicroelectronics, zoals de LSM6DSOX iNEMO is een machine-learning kern te vinden. De kern, gecombineerd met een eindigetoestandsautomaat (FSM, finite state machine) en geavanceerde digitale functies, is in staat om over te gaan van een status met ultra-laag vermogen tot een hoogperformante AI-capaciteiten met hoge nauwkeurigheid voor op batterijen werkende IoT, gamen, wearables en consumentenelektronica. Hij ondersteunt typische OS-vereisten en biedt realistische, virtuele en batch-sensors met 9 kbyte RAM die beschikbaar zijn voor dynamische data-batching.
Alhoewel kunstmatige intelligentie en machine-learning in al hun vormen blijven verbazen, zal het uiteindelijk de combinatie van nieuwe toepassingen, sterke uitvoer en het vermogen om de veiligheid te handhaven zijn, die ervoor zal zorgen dat we ze blijven gebruiken.
Have questions or comments? Continue the conversation on TechForum, DigiKey's online community and technical resource.
Visit TechForum




