Open source i military intelligence: Kan vi inte förenkla och hoppa över Snowden? För oss villiga att betala en slant för medarbetarnas tid

10/12/2013

En hel del kring open source känns ju mycket stabilt. Ex. plattform man inte modifierar i projekt där det distribueras runt som planerat normalt eller ev. out-of-planned-channell (så att säga). Samtidigt har jag viss respekt för att inte blanda komponenter i egna lösningar från annat jag inte har exakt definierat. Det ändå tveksamma där är en mycket fet kompilator som oavsett tveksam gratis-licens för kommersiell användning är för slö (och vars värde - en statistisk natural language parser - över regelbaserade inte bör göra någon skillnad alls för att skapa parsnings-traden jag ändå bryter och tar över för sekundär-parsning relaterat mening med egna vikter).


Men frågan är ju även om vi kan distruera något (om jag från ett par minuters tittande på text) kanske kan distruera kode givet jämförbara villkor och vet från annat definierat att dessa inte distribuerar vidare är ju frågan vad det innebär när den koden ändå distribueras vidare. Vi ser ju här att det påstås att NSA ska vara moln-troende och ser - liksom antar jag de flesta behövande prisvärda os-plattformar m.m. för stora nät - open source som funktionellt (och mycket korrekt distribuerar sin egen linux-distribution stängande kanske en del tveksamma dörrar och ev skapande en del nytta för användare resp. särskilt nu spekulerar jag crowd sourcar många amerikaner som vill dra sitt strå still den nationella stacken genom att leta säkerhetshål i koden):


"According to published slides, Boundless Informant leverages Free and Open Source Software—and is therefore "available to all NSA developers"—and corporate services hosted in the cloud. The tool uses HDFS, MapReduce, and Accumulo (formerly Cloudbase)[11] for data processing.[12]"

Från: Boundless Informant | Wikipedia

Vad jag funderar över på kanske vi bäst sammanfattar i kan vi få en massa ev. bra lösningar av Snowden nu som är tvingande givet pågående distribution där delar publicerats i the Guardian byggande på annan kod han har (spekulerar vi) och ev. andra runt om har tillgång till. Eller om vi känner namnen kan jag få det direkt på en hårddisk från NSA utan att behöva gå omvägen över Snowden (jag betalar givetvis för den och shipping).


Jag är särskilt intresserad på lösningar man kan ha byggt runt MapReduce där jag lätt betvivlar att algoritm och kod som finns (om jag minns rätt i open-source) inte modifieras mycket bättre både i praktisk mening rörande interaktion med egna datacenter, saker på internet via api:er m.m. såväl som själva algoritmen varande tror jag ganska kostsam för varierade miljöer (men säkert funktionell nog för ex. Google, Bing och Yahoo jag föreställer mig har mycket enhetliga grid:ar även om lite utspridda i stora cluster: Och dessutom kunnande betala för kanske delvis onödig redundans).


Rent personligt här har jag många gånger haft värde av Dtic.gov forskning publicerad så jag bjuder gärna till lite här för att hjälpa det amerikanska folket hålla sina nationella funktioner levande. Också givet att man ändå riskar en hel del tid själv för att hantera data och algoritmer till värde...


Rent hobby-mässigt är jag lite nyfiken på lösningar man använder för egen kryptering runt telefoni m.m. Har Snowden det också och kommer det kanske med krypteringstillstånd färdigt på hårdvaran? Kan jag begära sådant också från Snowden och NSA om det alls i något fall är möjligt? Eller räknas det inte in i open source grunkorna? Och p.s.s. hur det med meta-fält i call-detail-records, e-post-headers m.m.? Kan det när det parsas ses som del av en sådan lösning? Kan jag få ut det också av någon av dom här två intressenterna? Träningsdata i verklig bredd att små-sampla från för analys saknar jag verkligen i den storleksordningen - säkert med kulturella associationer och annat kontext ibland noterat - och särskilt om jag kan få det på färdig hårddisk vore det mycket användbart för språkmodeller. Jag kan slanta upp en rimlig summa rent - säkert välkommet nu när Obama har ont om pengar - för timmarna det tar att spara ned (säg $10 US per halvtimme med fördefinierad fast-total summa oräknat @300 US för hårddisk - bör rimligen räknas på NSA's antar jag massinköp görande det billigt - $500 US med för korekt service kanske lite extra till den som tar hand om det - beräknat för amerikanernas e-post - voice är jag mindre intresserad av - kommer färdiga språkmodeller me kan jag nästan garantera ett par hundra dollar i dricks).


Varande ett starkt stöd till hela open-source samhället genom att använt både Emacs och annat många år - regelbundet marknadsfört dessutom när jag behövt göra skärmdumpar med ex. och där korrekt utan att peka ut det för istället den effektivare implicta brand building - vill jag inte att värdet jag bidragit med genom det alla år inte här ska ge tillbaka. Det är ju hela poängen med det hela att den enskilda användare får ett värde medan alla får värde från det.


Relaterat: NSA's datagrid:ar

Dom ligger väl döda och oanvända nu? Kanske via något leaving-office-soon-innovation-support-program är det accepterat att medarbetarna kör lite egna saker för kommande konsultaffäer, data marketing eller programutveckling? I så fall har jag en bunt stora filer med concept-associationer extraherade Wikipedia ytterst arbetsamma att komprimera ner till räknat per koncept.


Föreslå gärna en prisuppgift om möjligt. Även om mitt behov är verkligt tänker jag dock inte betala några överdrivna ocker-priser. Jag kan tänka mig en dollar per timme och då ska det få tråda upp bra över flera saker med mycket minne och egna cpu:er. Men jag är heller inte orealistisk här. 50 potenta grunkor med några cpu:er var och bra med minne räcker fint för en vecka eller så.


Självklart: Har man annat bra data att sampla man börjat lämna ut av licens-skäl eller för att vara en bra team player i open-source eller andra subkulturer runt om i världen kan jag också vara intresserad. Jag har ju bl.a. varit road av att följa USA's stora politiker Obama och det kunde vara kul att göra en språkmodell av honom inkluderande hans dagliga kommunikation. Har man det lägger jag gärna en tio dollar extra om man stoppar med det på hårddisken: i dricks givetvis.


En hel jag laddat ner och sampat från Dtic.gov tyckte jag längre bakåt relativt tidpunkten där det köptes eller gjordes var imponerande. Jag skulle gärna ta en samling sådant men skrivet åren nu och bakåt säg tio år rörande särskilt innovation energi, datanalysalgoritmer, kommunikaton som del av vapensystem, och frågor relaterat människans kognitiva dimension som del av slagfältet. Det lär givet pdf-dokument och bilder kräva några hårddiskar till men den kostnaden kan jag riska här tycker jag. Går det att få i text utan bilder och pdf-data klart tar jag hellre det.


Men finns mer man tänker sig sälja ut eller är tvungen att lämna ut man tror kan vara intressant gäller så klart att om priset är rimligt (tänk på att så mycket numera bara är att spindla ner från nätet: så inga rövarpriser): Ge ett förslag! Och bry er inte om att oroa er för dricksen. I Sverige på restauranger är den lagstiftad så jag följer för säljarens trygghet den procenten (om det är en leverans jag är nöjd med).

0 kommentarer

Kommentera