Återpublicerad från Hans Husman om Media: Engångsmobiler: Att övervaka och databehandla stora mängder samtal utan vetskap om ägarens identitet
2013-09-04.
Kommentar jag gjorde i Is Bitcoin a currency? (Washington Post, 2013-09-01, Brian Fung) att spara här...
"Meta data doesn't require för existens association to a person id provided nor some technical platform by itself.
Can we follow language of the channel by itself it will appear as non-temporal data. Knowledge of clusters i.e. started from detection topics or just words indicating terrorism or such. From that you can build on keeping state reaching more exact.
Given such association to person is just the last stadge given appearing i clusters indicating danger. Perhaps even in the wave word of language (sound) easiest providing similarity to someone you follow ongoing. Expensive here still if your topic-clusters good enough to that many voice sign. to search for.
Finding geo position of the one is easy while still I guess often hard if used short times. But here some centrality of use probably often do appear.
I remember right are only the forrest guards in DHS around 150 - 200 000 federal agents. Counting out-from that and to collaboration local police a well done system and operation will provide. I doubt anything quite near this lever just yet."
Begränsningar här är om du kan området funktion av hårdvara och indata. Mer indata här kan för behov snabbt blir ganska stort under tidiga generationer för att etablera goda cluster. Där kan ju juridiska begränsningar också vara realitet.
Data kostar när det handlar om mycket. Lite spekulerande beroende på hur någon intresserad entitets programmerings-kultur är: närmare så i riktade egna lösningar resp. långsammare nära eller praktiskt användande Matlab för ex. matrisoperationer kan ev. ganska stor skillnad komma i möjlighet att utveckla riktad hårdvara som gör allt tungt förarbete nära strömmen av data (tror jag men är inte säker på vad skillnaden säkert är jämfört med t.ex. PC-clusters).
Och vi inser här ganska grundläggand viktigt att om våra mängder av cluster vi följer är baserade på mening behöver det inte reducera värde på den nivån om vi har en eller tio okända personer i samma kluster. Är meningen relaterat - kanske var för sig oberoende innovativa tankar om att svetsa om en gammal oljetanker till ett slagskepp och skjuta ner Frihetsgudinnan - är det jämförbart hot approxiativt i allt antagligen innan hantering så långt man i bästa fall kan ta det och / eller med jämförbara verktyg att kanske söka association till köp av via andra kanaler (jämför här även köp kontrollerade kemikalier via "skalbolag" - vad jag avser förstås säkert - för bombtillverkning eller kanske oftare syntes av narkotika). Tidpunkt och vad kan ibland tänkbart betyda mycket även utan geografisk plats, organisationsnummer, identitet på person eller full förståelse av målet.
Dock även om en resursstark aktör just har förutsättningar här vet jag bredare att samma typ av aktörer gärna tidigt köper in sig på lösningar egentligen underpresterande i nutid om än bra förr man lätt stannar i därför att de fungerar tycker man bra och göra något nytt är alltid jobbigt och kräver betydande summa initialt. Om det gäller NSA vet jag inte. Men glömmande att de är ganska gömda för oss i verksamhet och bara se dem som myndighet med ganska få restrains och uppföljning av budget är dom i risk för sådana problem (mycket uppföljning håller nog mången besökare från det politiska lagret när de träffat en matematiker som tagit sig tid några timmar att förklara korrelationsmönster läckande igenom något gammalt ryskt chiffer och hur man över mängder av data kan bevisa matematiskt att man förr eller senare ser en approximation av nyckel och S-boxar om dessa inte förändras). Samtidigt läcker så mycket från dem pågående sedan år att förstå att de inte helt sällan kommer tidigt i användning av algoritmer. Och efter att ha läst för värde såväl som analyseerat mindre delar (inte just PDF-dokumentar maskinellt) vad som publicerats hos Dtic.mil från den militära forskningen inom språk oh statisktanalys ska man ha klart för sig att särskilt längre bak i tiden föregriper värden som först långt senare tagits upp bredare ibland direkt till algoritm eller lösningssystem - ibland indirekt i rapporter tycker man delvis ca 1980 beskrivande vad man kan fundera ungefär kan motsvara hur de första iderna kring Wordnet kan ha sett ut men ej där eller i liknande direkt relaterat. Värde man sett om jag minns rätt rörande Wordnet fem eller kanske upp till åtta år innan det arbetet påbörjats.
Rörande Dtic.mil vill jag ska cokså kompletterande tips längre bak om dem på bloggen säga att när det gäller corpus vetenskap för att se utveckling och etablera vad som blivit inarbetade koncept är jag ytterst säker (utan att ännu fått tid eller sett värde nog för det givet att jag gjort det några kommer förr) en betydligt större potens jämfört med t.ex. CiteSeerX eller Arxiv.org. Jag brukar med hopp om framtiden spara allt jag läser hos dem (när jag kommer ihåg: men pdf-filerna varande fotostat-kopierade har jag inte ens prövat att försöka ta ut något från där det just är den regelmässigt i det ytterst troligt brutalt problematiska fösättsbladet man önskar med namn, sammanfattning, datum, dokumentsnummer, finansieringsindikationer, när gjort fritt att publicera).
Mycket trevligt projekt. Osäker på om de är tvinade att publicera det när ej längre hemligt. Tycks för mig dock inkludera en del intern forskning och inte bara finansierad forskning hos universitet (där en del juridiskt fanns åtminstone förr mycket möjligt ej alls aktuellt för äldre studier eller militärt: har aldrig förjupat mig i dom lagarna).
Så snabbare kanske i att ta upp värde. Men ej heller aldrig i domämer nämna att jag sett något väldigt banbrytande relativt tiden. Ibland kan man enkelt se att värdet tagits praktiskt genom uppföljande studier och kanske engagemang av deras egna kulturbärare (bl..a om jag kommer ihåg rätt deras forskare och expert rörande att uttrycka förenklat generellt språk rörande bl.a. verb: Minsky kanske är rätt person där - blandar lätt samman de vanligaste språken och deras skapare).
Kommentera