Firmenlogo der Technischen Visualistiknow with ssr
NLP-ba­sier­tes Tool zur Fil­te­rung von In­hal­ten in DIN-Nor­men

Ver­bes­ser­te Text­re­cher­che mit­tels Na­tu­ral Lan­guage Pro­ces­sing (NLP)

Die TVG hat für uns einen außergewöhnlich leistungsstarken Klassifikator entwickelt, der unsere Erwartungen übertroffen hat. Besonders beeindruckt hat uns die kompetente und verlässliche Zusammenarbeit über den gesamten Projektzeitraum hinweg. Das Team hat unser Problem schnell und präzise erfasst und eine Lösung geliefert, die sich klar von bisherigen Ansätzen abhebt. Für uns ist die TVG ein vertrauensvoller und langfristiger Partner!
Normen Günzroth, Projektleiter DIN Solutions GmbH

Ein­heit­li­che Nor­men und tech­ni­sche Spe­zi­fi­ka­tio­nen sor­gen da­für, dass Pro­duk­te und Dienst­leis­tun­gen den gän­gi­gen Si­cher­heits- und Qua­li­täts­an­for­de­run­gen ent­spre­chen. 

Wir ha­ben für die DIN So­lu­ti­ons GmbH, ein Un­ter­neh­men für Soft­ware­ent­wick­lung im Be­reich Nor­mung und Stan­dar­di­sie­rung, eine An­wen­dung ent­wi­ckelt, die mit Hil­fe von Na­tu­ral Lan­guage Pro­ces­sing (NLP) mit ho­her Ge­nau­ig­keit re­le­van­te In­for­ma­tio­nen aus Nor­men­do­ku­men­ten ex­tra­hiert und klas­si­fi­ziert. Da­mit leis­ten wir ei­nen wich­ti­gen Bei­trag zur Ver­ein­fa­chung der Ar­beit mit Nor­men­do­ku­men­ten. Die­se KI-ge­stütz­te Ver­ar­bei­tung von Tex­ten in na­tür­li­cher Spra­che er­leich­tert die Ar­beit mit den Do­ku­men­ten enorm.

Ef­fek­ti­ve Tex­t­ex­trak­ti­on ist der Grund­stein für den Er­folg

Im Zuge der Di­gi­ta­li­sie­rung wur­den die nor­men- und ver­lags­spe­zi­fi­schen Do­ku­men­te bei DIN in di­gi­ta­le For­ma­te über­führt. Die An­zahl der zu­gäng­li­chen Nor­men-Do­ku­men­te ist mitt­ler­wei­le auf etwa 40.000 an­ge­wach­sen. Um eine ef­fek­ti­ve Ar­beit mit die­sen um­fang­rei­chen Tex­ten zu er­mög­li­chen, wer­den un­ter­stüt­zen­de Tools be­nö­tigt. Die bis­lang ver­wen­de­te Soft­ware ist je­doch nicht in der Lage, die Kom­ple­xi­tät der na­tür­li­chen Spra­che aus­rei­chend zu er­fas­sen. Dies hat zur Fol­ge, dass die in den Nor­men ent­hal­te­nen Spe­zi­fi­ka­tio­nen zum Teil feh­ler­haft ex­tra­hiert wer­den.

Dar­über hin­aus hat sich die DIN So­lu­ti­ons GmbH zum Ziel ge­setzt, ei­nen Mehr­wert aus den In­hal­ten zu ge­ne­rie­ren. Mit der neu­en An­wen­dung sol­len Au­tor:in­nen, Part­ner oder Kun­den künf­tig über kon­text­ab­hän­gi­ge und ziel­ge­naue­re In­for­ma­tio­nen ver­fü­gen kön­nen. So wird bei­spiels­wei­se die zeit­rau­ben­de und feh­ler­an­fäl­li­ge Re­cher­che in den Nor­men­do­ku­men­ten ver­ein­facht.

Ef­fi­zi­en­te Re­cher­che durch KI-ge­stütz­te Sprach­ver­ar­bei­tung

Wir ha­ben NLP-Ex­trak­to­ren (je­weils für deut­sche und eng­li­sche Spra­che) ent­wi­ckelt, um die Ex­trak­ti­on von In­hal­ten aus Nor­men­do­ku­men­ten zu op­ti­mie­ren. Mit den Ex­trak­to­ren kön­nen In­for­ma­tio­nen schnell her­aus­ge­fil­tert und klas­si­fi­ziert wer­den, um die be­nö­tig­ten In­hal­te mit ho­her Ge­nau­ig­keit zu iden­ti­fi­zie­ren und aus­zu­ge­ben.

Die Viel­falt der na­tür­li­chen Spra­che er­fas­sen

Die Her­aus­for­de­rung lag vor al­lem in der Kom­ple­xi­tät der na­tür­li­chen Spra­che. Ein und das­sel­be Wort kann je nach Kon­text eine an­de­re Be­deu­tung ha­ben. Die Text­ana­ly­se er­for­dert da­her eine Tech­no­lo­gie, die die Be­deu­tung kor­rekt er­kennt. Die ein­ge­setz­ten Lar­ge Lan­guage Mo­del­le, also auf gro­ße Da­ten­men­gen trai­nier­te neu­ro­na­le Net­ze, kön­nen viel­sei­ti­ge Mus­ter er­ken­nen, den Kon­text ver­ste­hen und feins­te sprach­li­che Nu­an­cen be­rück­sich­ti­gen.

NLP als Bau­stein für eine Re­vo­lu­ti­on in der Text­ana­ly­se

Die Op­ti­mie­rung der Nor­men­re­cher­che durch un­ser NLP-ba­sier­tes Tool ist für die DIN So­lu­ti­ons GmbH ein gro­ßer Schritt in Rich­tung Ef­fi­zi­enz und Ge­nau­ig­keit bei der Be­ar­bei­tung von Nor­men­do­ku­men­ten. Zeit­rau­ben­de und feh­ler­an­fäl­li­ge Pro­zes­se ge­hö­ren der Ver­gan­gen­heit an.