Fraudedetectie
Van theorie naar praktijk
Binnen de voedingsindustrie heeft fraudedetectie twee betekenissen: financiële fraude en voedsel fraude. Bij financiële fraude gaat het meestal over klanten of leveranciers die fraude plegen inzake betalingen, terwijl in het tweede geval van voedselfraude voedsel of de verpakking van dit voedsel wordt vervalst. Door AI te integreren, krijg je automatisch en vaak in real-time meldingen van vermoedelijke fraude.
Toepassingen
Transacties zijn het levensbloed van een bedrijf. Echter, waar er transacties zijn, is er kans op fraude. Voor grote financiële instituten is AI die transsectionele fraude detecteert dan ook niet meer weg te denken. Maar niet enkele de grote financiële instituten hebben baat bij AI-gedreven fraudedetectie. Denk maar aan supermarkten die self-checkout aanbieden. Een klant kan bijvoorbeeld een fles wijn wegen als wortels. Met behulp van beelddetectie kun je echter elke fysieke transactie registreren en dergelijke onregelmatigheden detecteren.
Wanneer je advertenties online plaats, loop je ook risico om slachtoffer van fraude te worden. Adverteerplatformen rekenen bijvoorbeeld aan op basis van het aantal keer dat mensen op jouw advertentie klikken. Echter worden in bepaalde gevallen deze kliks op de achtergrond met de computer gegenereerd, met zogenaamde “bots”. Je denkt dus dat mensen je advertenties bekijken, maar eigenlijk zijn het bots. Met behulp van AI kun je echter de patronen van die kliks analyseren en achterhalen of het kliks van bots of van mensen zijn.
In de voedingsindustrie heb je natuurlijk ook voedselfraude. Dat gaat dan vaak over producten die een andere origine hebben dan geadverteerd, verkeerd gelabeld zijn, of producten die bijvoorbeeld verdund zijn. In 2013 werd in Europa bijvoorbeeld paardenvlees gevonden in maaltijden die gelabeld waren als rundsvlees, terwijl in India melk vaak wordt verdund met water. De gevolgen van voedselfraude zijn verreikend en kunnen een directe impact op de gezondheid van klanten hebben. AI kan echter een grote rol spelen in het detecteren van voedselfraude.
Rijstfraude is bijvoorbeeld een bedreiging voor de rijstindustrie. Verschillende soorten rijst worden dan met elkaar gemixt, maar geadverteerd als één bepaald soort rijst. Dit soort fraude detecteren is zowel tijdrovend als kostelijk. Door AI te combineren met een zogenaamde elektronische neus, is het echter mogelijk om de soorten rijst snel en relatief goedkoop te herkennen. Op een gelijkaardige manier kun je ook de verdunning van sesamolie met zonnebloemolie herkennen, kikkererwtenmeel onderscheiden van gembermeel, en de artificiële toevoeging van water in melk detecteren.
Tot slot kun je met AI ook effectiever de oorsprong van producten herkennen, zoals de geografische oorsprong van asperges of de authenticiteit van wijn.
Vereisten
Data
- Transactionlog met vastgestelde frauduleuse en niet- frauduleuse transacties
- ~Inclusiefcase-relevante attributen (afhankelijk van het domein) zoals timestamps,uitvoerder, bedragen…
Hardware
- Standaardcapaciteit voor data verwerking en dataopslag
Algoritme
- Classificatietechnieken
- ~Recurrent neural network (f.e. LSTM)
- ~Decision trees / random forest
- ~Support vector machines
Aandachtspunten
- Transparantie is mogelijk een must. Het kan een vereiste zijn dat fraude detectie uitgevoerd wordt via transparante, verklaarbare beslissingslogica. Indien dit inderdaad een vereiste is, dan zijn de ML technieken die gebruikt kunnen worden beperkt en/of er dienen post-hoc verklaringen voorzien te worden.
- Voeg domeinkennis toe via feature engineering. Feature engineering, waarbij informatie die impliciet beschikbaar is binnen de dataset, expliciet wordt toegevoegd als een attribuut, is een zeer belangrijke toegevoegde waarde.
- Kies een geschikte evaluatiemetriek. Evaluatie van de fraude detectietechniek kan niet gemeten worden aan het percentage van juist voorspelde cases. Globale metrics worden gedomineerd door de grote frequentie van niet-frauduleuse cases. Een betere keuze is bijvoorbeeld de zogenaamde F1-score.
Stappenplan
- Bepaal evaluatiemetrieken en KPI’s voor toekomstige oplossing
- Verzamel transactielog van frauduleuse en niet-frauduleuse cases
- Bevraag domein experts en achterhaal welke indicatoren wijzen op een mogelijk fraude-geval.
- Doe aan feature engineering om de informatie die domein experts zouden gebruiken rechtstreeks beschikbaar te maken voor ML technieken.
- ~Maak eventueel gebruik van process mining (procesvariant) en/of NLP (word vectors) om nuttige informatie toe te voegen.
- Train en test verschillende ML technieken voor classificatie
- ~Maak een train/validatie/test split in de dataset
- ~Train ML model op trainingsdata
- ~Finetune ML model op basis van validatiedata
- ~Rapporteer performantie op basis van testdata
- ~Selecteer ML model met beste testresultaten
- Design operationele data pipeline voor data retrieval & feature engineering
- Deploy ML model
- Voorzie feedbackmechanisme voor fraudevoorspellingen in de praktijk
- Monitor ML model performance
Partners
Hulp nodig bij de implementatie van deze AI-toepassingen?
Ontdek hier enkele technologiepartners.