SSN badania – FAQ

Original: http://www.heinz.cmu.edu/~acquisti/ssnstudy/

Alessandro Acquisti (Heinz College, Carnegie Mellon University)
Ralph Gross (Heinz College, Carnegie Mellon University)
Z wdzięcznością uznajemy wsparcie badań z National Science Foundation w 0713361 dotacji, z biura badań armii USA w ramach umowy DAAD190210389, z Carnegie Mellon CyLab i Funduszu Berkman i od centrum superkomputerów Pittsburgh
Również chcielibyśmy podziękować Jimin Lee, Ihn Aee Choi, Dhruv Deepan Mohindra, a w szczególności, Ioanis Alexander Biternas Wischnienski do badania asystenta.
Jest to projekt dokumentu. Będzie dodajemy Q & jak możemy otrzymać lub przeczytać istotne pytania o badania w komentarze i e-maile. Proszę o wyrozumiałość jak dodać zawartość i dążyć do końcowego, czysta wersja tego FAQ. Dziękujemy!


Indeks
Pytania ogólne:
• Jaki jest tego badania?
• Dlaczego czy to ma znaczenie? Dlaczego jest taki przewidywalności problem?
• Jakie konsekwencje wyników?
• Dlaczego jesteś publikowania tych wyników?
• Jakie kroki czy podjęte przed opublikowaniem wyników?
• W jaki sposób wyniki można rozwiązać problem kradzieży tożsamości? Czy masz praktyczne zalecenia?
Pytania techniczne:
• Co dokładnie to oznacza, że SSNs “przewidywalne”?
• Jak zrobić takie Wróżby pracy?
• Jak zrobił ty Sprawdź swoje prognozy?
•Jeśli algorytmu tylko produkuje okna wartości mogących zawierać prawidłowe SSN, dlaczego jest to problemem?
•Miej ci “złamane” tajnego kodu? Nie Social Security Administration publicznie ujawnia informacje na temat systemu przydziału?
•Isn’t ten stary news? Każdy wie, że obszar numery związane z Państwa (itp.)
Przewidywalność SSNs może prowadzić do kradzieży tożsamości? Czy ta publikacja badań pouczać złodziei tożsamości na jak zdobyć SSNs?
• Jak to różni się od poprzednich badań?
• Jakie dane czy trzeba przewidzieć SSN? Nie urodzenia danych jest trudne do zdobycia?
•Z które towarzyski tworzenie sieci umiejscowienie zrobi³ ty znaleźć danych dla jednego z testów?
•Aren’t SSN w rzeczywistości jako dostępne jako data urodzenia?
• Czy można dokładnie przewidzieć, * co * SSN?
•Jak, jakie można przewidzieć wiele rzeczywistych SSNs?
•Doskonale umieszczone w Internecie moja data urodzenia. Mój SSN zostało “złamane”?
•Aren’t danych narusza większy problem?
•ISN, to taniej jest po prostu zapłacić broker danych do zdobycia SSN danych?
•Isn’t to przypadek, że SSNs, sam, nie wystarczające, aby podszyć się pod osobę? Banki i inne usługi poprosić o dodatkowe informacje (np. matka maiden imię, nazwa pet i tak dalej).
•Jeśli SSNs były już używane do uwierzytelniania, co jeszcze możemy wykorzystać?
•WHO finansowane badania?
•Were testy IRB zatwierdzonych?


Streszczenie
PESEL zostały utworzone zgodnie z ustawa o zabezpieczeniu społecznym z 1935 jako identyfikatorów kont śledzenia poszczególnych zarobków. Jednak z czasem zaczęli, używany jako wrażliwe uwierzytelniania urządzeń, stając się jednym z elementów informacji najczęściej poszukiwane przez złodziei tożsamości: znajomość osoby nazwa, SSN i danych urodzenia, często jest warunkiem wystarczającym do podszycia się pod tym indywidualne i uzyskaj dostęp do szeregu usług, prowadzących do kradzieży tożsamości tzw. Obecnej polityki publicznej w obszarze kradzieży tożsamości sugeruje, że SSNs powinny być uważane za poufne: konsumenci jesteście nastawać wobec ochraniać ich SSNs. Jednakże możemy pokazać, że jest to możliwe do przewidzenia poszczególnych SSNs po prostu z publicznie dostępnych danych. W oparciu o obserwację wzorów wystawiania w “Śmierć głównego pliku” (bazie publicznego, który zawiera SSNs ludzi, którzy zginęli), mogliśmy korzystać z informacji o datę indywidualnego i Państwa urodzenia do przewidzenia wąskich przedziałów wartości mogących zawierać tej osoby w SSN. Prognozy są szczególnie dokładne dla SSNs ludzi, którzy urodzili się po 1988 roku (Kiedy SSA zainicjowane Wyliczenie urodzenia program, dzięki któremu dzieci otrzymują SSNs wkrótce po urodzeniu) i w państwach z spadku populacji. Ponieważ SSNs są przewidywalne danych publicznych, kradzieży tożsamości może wystąpić nawet bez wydarzeń, takich jak dane naruszenie. Niektóre skutki są że 1) SSA należy losowo cały proces przypisania SSN; 2) bieżących inicjatyw w obszarze kradzieży tożsamości i SSN powinny zostać ponownie rozważone: Większość polityki obecnie skupia się na usunięcie SSNs z bazy danych lub skracanie ich cyfr, tak że mogą być nadal używane jako “poufne” – jednak, ponieważ SSNs są przewidywalne, w przeciwnym razie publicznie dostępnych danych, SSNs nie może być uważane za poufne nawet, jeśli są one usuwane z bazy danych, a więc tych inicjatyw może być nieskuteczne; 3) od SSNs można przewidzieć i w związku z tym, są w pewnym sensie, pół-informacyjną, konsumenci nie powinniście być zmuszeni przez podmioty sektora prywatnego do wykorzystania SSNs, jako hasła lub uwierzytelniania.

Pytania ogólne

Pyt.: co to jest tego badania?
Studiował system przydziału numerów PESEL (SSNs) i odkrył, że całkowicie z publicznych danych można przewidzieć poszczególnych SSNs. W szczególności okazało się, że jest możliwe do łączenia informacji ze źródeł rządowych z proste dane demograficzne (np. osoby stan i data urodzenia, powszechnie dostępne z komercyjnych bazach danych, listy rejestracji wyborców lub internetowych sieci społecznościowych) do przewidzenia wąskich przedziałów wartości, w którym poszczególne SSNs narażone na spadek.
Q. Dlaczego ważne badania? Dlaczego jest przewidywalność SSNs problem?
SSNs mają być poufne informacje przewidywalność SSNs zwiększa ryzyko kradzieży tożsamości ogromnej skali.
SSNs były pierwotnie zaprojektowany w 1930 roku mają być używane jako identyfikatory rachunków śledzenia poszczególnych zarobków. Jednak z biegiem czasu, zaczęli, używany do ” uwierzytelniania ” w szereg z prywatnego sektora usług to jest do sprawdzenia tożsamości i określić, czy jest ktoś kto on jest domaga się. W związku z tym przyszło być uznawane za poufne informacje. Wrodzonych napięć między pomocą taki sam numer jak identyfikator konta (które mogą być udostępniane osobom trzecim) oraz “hasło” (który jest przypuszczalny zostaæ prywatne i poufne) przyczynił się do powstania kradzieży tożsamości. W USA, znajomość czyjeś imię, datę urodzenia i SSN jest często warunkiem wystarczającym do podszycia się pod osoba finansowe, medyczne lub innych rodzajów oszustw. W związku z tym jeśli SSNs można przewidzieć na podstawie danych publicznych, zwiększa ryzyko kradzieży tożsamości.
Pyt.: Jakie konsekwencje wyników?
Po pierwsze: SSNs, w ich obecnej formie, bardzo niebezpieczne haseł i nie powinny być używane do uwierzytelniania. Jeśli pomyślnie można zidentyfikować wszystkie dziewięć cyfr SSN w mniej niż 10, 100 lub nawet 1000 próby, że numer PESEL jest nie bardziej bezpieczne niż 3 cyfrowy numer PIN. Zarówno agencje rządowe (w tym SSA i FTC), jak i naukowcy (np. [LoPucki, 2003], [Samuelson, 2007], [Solove’a, 2003]) ostrzegają przed użyciem SSNs dla uwierzytelniania. Niestety SSNs nadal używane (i nadużywane) wszędzie w sektorze prywatnym do uwierzytelnienia tożsamości, która prowadzi do powszechnego przestępstwa kradzieży tożsamości.
Drugi: Bieżący prawnych i politycznych inicjatyw w dziedzinie zapobiegania kradzieży tożsamości które koncentrują się na usunięcie SSNs z narażenia ludności, lub skracanie ich pierwsze pięć cyfr dobre intencje, ale może być źle bo nawet zredagowana lub usunięty SSNs pozostaje przewidywalna od dane udostępniane publicznie.
Po pierwsze: SSNs, w ich obecnej formie, bardzo niebezpieczne haseł i nie powinny być używane do uwierzytelniania. Jeśli pomyślnie można zidentyfikować wszystkie dziewięć cyfr SSN w mniej niż 10, 100 lub nawet 1000 próby, że numer PESEL jest nie bardziej bezpieczne niż 3 cyfrowy numer PIN. Zarówno agencje rządowe (w tym SSA i FTC), jak i naukowcy (np. [LoPucki, 2003], [Samuelson, 2007], [Solove’a, 2003]) ostrzegają przed użyciem SSNs dla uwierzytelniania. Niestety SSNs nadal używane (i nadużywane) wszędzie w sektorze prywatnym do uwierzytelnienia tożsamości, która prowadzi do powszechnego przestępstwa kradzieży tożsamości.
Drugi: Bieżący prawnych i politycznych inicjatyw w dziedzinie zapobiegania kradzieży tożsamości które koncentrują się na usunięcie SSNs z narażenia ludności, lub skracanie ich pierwsze pięć cyfr dobre intencje, ale może być źle bo nawet zredagowana lub usunięty SSNs pozostaje przewidywalna od dane udostępniane publicznie.
Po trzecie: Szerzej, nasze wyniki podkreślają nieoczekiwane skutki oddziaływania wielu źródeł danych w nowoczesnej gospodarki. Pokazują one jak niewrażliwe osobistych danych (takich jak informacje osób ujawnić o sobie online) mogą być łączone z innymi źródłami danych, również niewrażliwe, prowadzące do wnioskowania o wiele bardziej wrażliwe informacje.
Pyt.: Dlaczego wydawnictwa te wyniki?
SSNs bardzo niebezpieczne hasła. Jednak pomimo ostrzeżeń przez liczne agencje rządowe (w tym SSA i FTC), one często używane w sektorze prywatnym, zarówno jako identyfikatory i uwierzytelniania powoduje to koszty i szkody miliardy dolarów rocznie do przedsiębiorstw i konsumentów. Naszym celem jest pokazanie, że w ich obecnej formie, SSNs zagrożone jako hasła; do wpisu nie tylko politycy, ale również przedsiębiorstwa i konsumentów do zagrożeń dla poszczególnych tożsamości wynikających z użytkowania (i nadużycie) SSNs jako metodę uwierzytelniania; i przyczynić się do debaty na bardziej wydajne, bezpieczne i zachowania prywatności środków weryfikacji tożsamości w naszym społeczeństwie informacyjnym.
Kradzieży tożsamości jest tak powszechne w USA, ponieważ PESEL incongruously wykorzystywane przez przedsiębiorstwa, zarówno jako identyfikatory i hasła coś, czego nigdy nie miały one być [Smith, 2002]. Jest to praktyka, który na Uniwersytecie Kalifornijskim w Berkeley, w klinice Samuelson zdefiniowany jako ” nieodpowiedzialne ” [Samuelson, 2007] i że prawo uczony Daniel Solove’a ma określone jako “architektura luki” [Solove’a, 2003]. W USA całkowite koszty kradzieży tożsamości w 2007 r. oszacowano na 49,3 miliardów dolarów [Johannes, 2006]. Jak Chris Hoofnagle zauważyć [Hoofnagle, 2007], koszty te rodzą się przez wszystkie strony, ale przede wszystkim przez konsumentów, zarówno bezpośrednio (stracony czas, niedogodności i out-of-pocket koszty) lub pośrednio (poprzez wyższe opłaty wypłacane usług kredytowych, lub jako podatników, gdy instytucje finansowe odpisują straty kradzieży tożsamości przy obliczaniu ich korporacyjnych podatków dochodowych). Ponadto dodatkowe koszty ponoszone co roku nawet w przypadku braku nadużyć, ze względu na koszty spowodowane próbą obrony oraz wykorzystać, system [idanalytics, 2005] należy rozważyć na przykład, inwestycje, które firmy i osoby zobowiązane do poniesienia w celu ochrony poufnych danych. Pokazując, że SSNs przewidywalne danych publicznych, a zatem nieodpowiednie jako hasła, mamy nadzieję powstrzymać koszty związane z ich wykorzystaniem jako sposób weryfikacji tożsamości i przekierować uwagę w kierunku postępu badań na metody uwierzytelniania bezpieczne, zachowania prywatności od 2-czynnik uwierzytelniania certyfikatów cyfrowych.
Pyt.: jakie kroki czy podjęte przed opublikowaniem wyników?
Wśród innych rzeczy możemy mieć pominięty poufne informacje na temat strategii przewidywania z opublikowanego artykuł, i podzieliliśmy nasze wyniki z agencji rządowych przed ich publikacją.
Pyt.: jak można wyniki do rozwiązania problemu kradzieży tożsamości? Czy masz praktyczne zalecenia?
Wyniki sugerują, wiele uwagi i możliwe strategie dla podmiotów sektora prywatnego i publicznego, jak również dla osób.
Agencje rządowe
Przypisanie programu SSNs można by zmienić na włączenie prawdziwej losowości. To by wyeliminować ryzyko przewidywalności dla nowo przypisana SSNs jednak nie zrobi wiele, aby chronić setki milionów SSNs już przypisany. To również może nas zadowolone z zachowania systemu bieżącegoi niepewnygdzie SSNs incongruously wykorzystywane przez podmioty sektora prywatnego, zarówno jako publiczne identyfikatory i hasła prywatne roli, SSNs nigdy nie miał do spełnienia, gdy zostały one zaprojektowane w 1930 roku. Agencje rządowe (i polityków) zamiast rozważyć incentivizing podmioty sektora prywatnego do rezygnacji z użycia (i karania nadużyć) z SSNs oznacza uwierzytelniania, i może zachęcić badań akademickich i branżowych na stosowanie środków bardziej wydajne, bezpieczne i zachowania prywatności uwierzytelnianie elektroniczne 2-czynnik uwierzytelniania i certyfikatów cyfrowych.
Politycy
Obecna polityka, którą inicjatyw w dziedzinie zapobiegania kradzieży tożsamości i ochrony SSN może być reevaluated [LoPucki, 2003]. Wielu obecnych inicjatyw w tej dziedzinie (patrz [GAO, 2008], [FKH, 2008]), a także 2007 zaleceń prezydenta Identity Theft Task Force, dobre intencje; Jednak, skupiają się na usunięcie SSNs z publicznej ekspozycji (lub skracanie ich pierwsze pięć cyfr), aby zachować SSNs roli wrażliwe numery i oznacza uwierzytelniania [prezes Identity Theft Task Force, 2007]. Nasze wyniki, zamiast, sugerują, że podejście koncentruje się wyłącznie na usunięcie lub skracanie SSNs może być nieskuteczne, lub błędne: przypisany SSNs nie mogą być odwołane, aby uniknąć przyszłych nadużyć, narażone dane nie mogą być odebrane, a ten pierwszy 5 cyfry SSNs te, w rzeczywistości, łatwiej wywnioskować. Tej liście nawet redacted lub obcięte SSNs nadal przewidywalne i, w związku z tym, nadal narażone.
Credit Reporting agencje, instytucje finansowe i inne
CRA i instytucjami finansowymi Zaniechaj używania SSNs dla uwierzytelniania (oznacza to, że jako dowód tożsamości) oraz wzmocnienia ich dopasowania strategii i technik uwierzytelniania tożsamości. Raporty z FTC [FKH, 2004] i uczelniami [Hoofnagle, 2007] podkreślają, jak wniosków kredytowych z niepoprawnymi nazwami lub nawet błędne SSN cyfr rutynowo akceptowane jako prawidłowe, (bo raportów kredytowych znane zawiera błędy i nieścisłości). Takie praktyki zostawić otwarte “dziury” w infrastrukturze weryfikacji tożsamości to oszuści mogą i wykorzystać.
W rzeczywistości zarówno agencji sprawozdawczości kredytowej, jak i inicjatyw takich jak E-Sprawdź i SSNVS należy zwrócić uwagę szczególną i podwyższone próby tożsamości zbrodni, które opierają się na “upadki.” Upadki to praktyka cyber przestępcy, że już zostało udokumentowane i który składa się z nieco zmienia numeryczne szczegóły w oszukańczych aplikacji, takich jak adresy i, w rzeczywistości, manipulacji SSNs znany w wielu aplikacjach konto [idanalytics, 2005].
Usługi online
Usługi online, które po lub umożliwiają członkom opublikować informacje demograficzne (od ludzi online Szukaj usług internetowych sieci społecznościowych) należy rozważyć strategie (od wyboru odpowiednich domyślne ustawienie odpowiednich zabezpieczeń Zasady działalności), że jak najwięcej możliwe próby zrównoważenia potrzeby za darmo przepływów danych i wymiany z ochrony przeciwko nadużyciom tych danych, wprowadzenie szczególną uwagę pod uwagę, że nawet niewinne dane mogą być odtwarzane do produkcji bardziej wrażliwe informacje z innych źródeł.
Konsumentów
Realizując potencjał wykorzystania dokumentów publicznych jako “hodowcy” dokumenty bardziej wrażliwych danych, jako konsumentów, możemy lepiej podejmować świadome decyzje, handel off i porównanie korzyści informacji online dzielenie z jego potencjalnych kosztów. Jednak problem nasz papier podkreśla wykracza poza kontrolą użytkowników to jest problem systemowy ze względu na wyzysk SSNs dla celów (uwierzytelnianie) nigdy nie zostały zaprojektowane do spełnienia. W związku z tym nacisk na prośbą konsumentów, aby “chronić” ich SSNs [SSA, 2007] może być niewłaściwie, jeśli nawet życzliwi konsumentów SSNs może być zagrożona ze względu na informacje, które wykazały, inne podmioty o nich. Innymi słowy, nasze wyniki wskazują, że problem bezpieczeństwa SSNs wykracza znacznie poza konsumentów odpowiedzialności i kontroli: ma do czynienia z wykorzystaniem (i nadużycie) z SSNs w sektorze prywatnym dla celów (takich jak uwierzytelnianie) nigdy nie zostały zaprojektowane do spełnienia. Jako konsumenci mamy bardzo mało kontroli w tej sprawie. Na koniec dnia to jest problem systematyczne, że przemysł, decydentów politycznych i oczywiście naukowcy muszą rozwiązać.

Pytania techniczne

Pyt.: co dokładnie to znaczy że SSNs “przewidywalne”?
Oznacza to, że informacje o poszczególnych państw i data urodzenia może być wystarczające do statystycznie wywnioskować, wąskich przedziałów wartości, w którym osoba w SSN jest prawdopodobne, aby spadek.
” Czy ”, bo to prawda (w ogólnym i uproszczenie trochę rzeczy) tylko dla osób, które otrzymały ich SSN wokół w momencie ich urodzenia (do 2005 r., co najmniej 92% SSNs przypisany do obywateli USA zostały przydzielone w chwili urodzenia [SSA, 2006], procentowy udział osób przyjmujących ich SSNs wokół w chwili ich narodzin zaczął znacznie wzrasta w późnych latach osiemdziesiątych wyniku Wyliczenie inicjatywy urodzenia).
“Zakresy wartości” oznacza, że prognozy oparte na statystycznej wniosków: ogólnie rzecz biorąc, można przewidzieć ten pierwszy 5 cyfry z bardzo wysokiego stopnia dokładności z jednej próby zwłaszcza dla osób urodzonych po 1988 i mniej zaludnionych państw. W niektórych przypadkach, byliśmy w stanie przewidzieć całej 9 cyfr poszczególnych SSNs na pierwszą próbę. Coraz częściej prognoz produkcji okien wartości, które mogą zawierać rzeczywisty 9 cyfr. Te okna mogą być bardzo duże (i, w związku z tym, niedokładne) dla niektórych lat i Państwa (na przykład, dla osób ur w Kalifornii w 1973 roku), ale można dostać bardzo wąski (i dlatego więcej dotyczące, jeśli chodzi o ryzyko kradzieży tożsamości) dla mniejszych państw i ostatnich lat (na przykład 1 / 20 SSNs urodził się w DE w 1996 roku w naszym zbiorze danych osób może być utożsamiana z tylko 10 lub mniej próby na SSN).
Pyt.: jak działają swoje prognozy SSN?
Nasze prognozy opiera się na fakcie, że SSNs przypisywane zgodnie złożonych jeszcze regularne i dlatego przewidywalne wzór. Prace przewidywanie oparte na interpolacji indywidualnego data i Państwo urodzenia z SSN wystawiania wzorów pochodzi z tzw “śmierć głównego pliku”, plik publicznie dostępnych sprawozdań SSNs, nazwiska, daty urodzenia i śmierci i Państwa SSN aplikacji dla osób, których zgonów odnotowano SSA (również znany jako SSDI lub SSN Death Index). Częścią tego procesu jest opisana w dokumencie PNAS. Niektóre szczegóły zostały uwzględnione na publikację.
Pyt.: jak zweryfikujesz swoje prognozy?
Prowadziliśmy dwa testy. W pierwszym badaniu możemy wykreślić zapisy SSNs śmierci plik główny (DMF) czasu dla danych między 1973 a 2003. Zaobserwowaliśmy, że statystyczny wzorców, które pojawiły się w DMF danych; następnie kiedyś te wzory do przewidzenia rekordów SSNs DMF. W drugim badaniu interpolowana dane demograficzne, pochodzących z uczniów profile sieci społecznych, ze wzorów pochodzących z DMF i używane do przewidywania właścicieli profil SSNs. Możemy zweryfikować dokładność naszych prognoz dla osoby rzeczywisty SSNs przy użyciu protokołu bezpieczne, IRB zatwierdzonych, anonimowych, które produkowane tylko wartość zagregowana statystyki, nie ujawniając nam rzeczywiste SSN dowolnej osoby w szczególności.
Q. Jeśli algorytm produkuje tylko windows wartości mogących zawierać prawidłowe SSN, dlaczego jest to problemem?
Ponieważ różnych usług online sektora publicznego i prywatnego może zostać zaatakowany do badania (za pomocą weryfikacji bydlę siła) podzbiory zmiany przewidywane przez algorytm.
Statystycznej prognozy windows możliwe SSNs nie oznacza sam, że będzie można znaleźć dokładne SSN. Jednak gdy zakres wartości, w którym jest prawdopodobne, aby spadek SSN zostanie znacznie zmniejszona, liczba “brute force” ataków, co byłoby inaczej nieskuteczne lub niemożliwe staje się możliwe i wykonalne. Po jednym lub dwóch prób wystarczające do identyfikowania znaczną część wydanych SSNs pierwszych pięciu cyfr, atakujący ma zachęty do inwestowania środków do zbierania, pozostałe cztery z dokumentów publicznych lub komercyjnych usług. Gdy mniej niż 10, 100 lub 1000 próby wystarczające do identyfikowania kompletne SSNs do ogromnej ilości tarcz, atakujący może wykorzystać różnych usług online sektora publicznego i prywatnego (takich jak online kredytowych “instant” zatwierdzenia strony, jak wspomniano w dokumencie) do testowania podzbiór przewidywane przez algorytm w celu sprawdzenia co SSN odpowiada osoba z data urodzenia danej odmiany.
 
Pyt.: Czy można “złamane” tajnego kodu? Nie Social Security Administration publicznie ujawnia informacje na temat systemu przydziału?
Nie, nie mamy złamane tajnego kodu, i tak, system przydziału jest publicznie dostępny. SSN przypisanie programu została utworzona w 1930 roku i nie został zaprojektowany, aby być “bezpieczne”: wtedy, nie był to wyobrazić, że pewnego dnia SSNs zaczną używany do uwierzytelniania. Schemat przydziału jest złożona, i że złożoność doprowadziło do przekonania, że przypisanie, z punktu widzenia użytkownika, jest skutecznie losowe (zobacz ” SSNs losowane komputerowo w granicach obszaru numery przydzielone do konkretnego Państwa na podstawie danych opartych na kluczach do systemu wyliczania zmodernizowany [SSA, 2001]). Rzeczywiście możemy tylko używane publicznie dostępnych informacji, a zakończył się po odkryciu, na podstawie tych informacji, przypadkowość skutecznie jest tak niska, że całe 9 cyfr SSN można przewidzieć z ograniczoną liczbę prób. Odkryliśmy, że niektóre interpretacje przypisanie programu odbędzie się poza SSA były, w rzeczywistości, błędne.
Pyt.: czy nie jest to stare wiadomości? Każdy wie, że obszar numery związane z Państwa (itp.)
Tak, system przydziału SSN jest dobrze znany i tak, na istnienie związku między obszar numery i Państwa jest znane opinii publicznej ale wzorców, które odkryliśmy (i dokładności prognoz opartych na nich) nie .
Jak zauważono w rękopisie, schemat przydziału SSN jest publiczny wiedzy (str. 1). W rzeczywistości, wcześniejsze prace w tej dziedzinie używane te wzory aby oszacować, kiedy i gdzie SSN może zostały wydane (p. 1 i [Wessmiller, 2002 r.], [Sweeney, 2004], [EPIC, 2008]: oznacza to, że począwszy od * znane * SSN i stara się rozpoznać stan i zakres lat kiedy to może zostały wydane. Zamiast tego, nasza praca koncentruje się na odwrotnej, trudniejsze i znacznie bardziej pośrednie wnioskowanie: wykorzystanie podejrzewane o dokładną datę i miejsce wystawienia SSN dość wiarygodne oszacowanie SSNs. Stało się to możliwe, ponieważ:
Odkryliśmy (p. 3) który interpretacji * poza * SSA o jak przypisane numery obszar był błędny: widok obiegowa o ich przypisania, w przeciwieństwie do samego służy do 9999 SSNs kolejno przypisany (w interpretacji przypisanie programu odbędzie się poza SSA, SSA wierzono, że obrót przez wszystkie Państwa i dla każdego przypisanych SN. Taki system uczyniłoby losowo dla Państwa wiele ANs i prezentujemy w niniejszym artykule znacznie mniej dokładne prognozy).
Odkryliśmy (str. 4), że przypisanie ostatnie 4 cyfry jest nie tylko kolejne (jak rzeczywiście stwierdzono w publicznie dostępne informacje na temat systemu przydziału), ale w rzeczywistości wysoce skorelowane z data urodzenia wnioskodawcy i dlatego nie losowo (Uwaga: SSA stanowi natomiast, że ” SSNs losowane komputerowo w granicach obszaru numery przydzielone do konkretnego stanu ” [SSA2001]). W różnych przypadkach, byliśmy w stanie przewidzieć cały 9 cyfr SSN w pierwszej próbie (szanse, że dzieje się przez przypadek chyba mniej więcej 1 ponad 1 mld). Jest to szczególnie w przypadku SSNs przypisany po wystąpieniu organu (1987 r.).
Odkryliśmy że analiza publicznie dostępne SSNs przypisane do osoby zmarłej (i zawarte w DMF) pozwala wniosków granulowany przypisania wzorach, które sprawiają, że jest to możliwe do przewidzenia SSNs osób żyje. Na przykład, relacji między obszar numery i Państwa, podczas publicznej wiedzy, nie będzie wystarczające, sam, aby przewidzieć numery obszar z wyjątkiem w bardzo szczególnych przypadkach (patrz p. 1): niski ludności Państwa (takie jak WY) i niektórych posiadłości Stanów Zjednoczonych przydzielane 1 Każdy sugerując, że wiedza, że osoba stosowanych dla swojego SSN w tym państwie lub posiadanie czy rzeczywiście dostarcza prawie pewną wiedzę, pierwsze 3 cyfry swojego SSN. Jednak, innych państw przydzielane * zestawów * z ANs. Na przykład, osoba wnioskująca z zipcode w stanie Nowy Jork można przypisać którekolwiek z 85 możliwe pierwsze 3 cyfry SSN. W związku z tym że osoba stosowane do jego SSN w tym państwie zapewnia niskie kursy (1 ponad 85) zgadując swoje pierwsze 3 cyfry z jednego losowo przypuszczenie wiedzy. Kursy nie zawierają nawet prawdopodobieństwo również zgadując Grupa liczby które różnią się od 01 do 99, w połączeniu z różnymi numerami obszar.

W skrócie, bez odkrycie wzory łączenia cyfry SSN do danych demograficznych, znajomość programu przypisania nie byłoby wystarczające do przewidzenia ani ten pierwszy 5 cyfry lub w rzeczywistości cały 9 cyfr SSN o stopniu dokładności należy narażać ich praktyczne ryzyka identyfikacji. Na przykład prawdopodobieństwo zgadując ten pierwszy 5 cyfry SSN indywidualnej urodził się w NY w 1998 r., nawet przy założeniu, że wiedzą, że SSN zostało wydane w tym państwie, będzie 0,012%, a prawdopodobieństwo zgadując że cały 9 cyfr z mniej niż 1000 próby wynosi 0.0012%. Jednak w bardziej szczegółowe zrozumienie relacji między zadania programu i demograficzne wzorów opisanych w rękopisie, tych prawdopodobieństw 30% i 3% odpowiednio: kilka rzędów wielkości większa i bardziej podatne na ataki bydlę siła. Na str. 27 o dodatkowe informacje, patrz tabela 6.
Pyt.: czy przewidywalność SSNs prowadzić do kradzieży tożsamości? Czy publikacja badań stanowi wszystko jest potrzebne, aby zdobyć SSNs?
Nr. Pomijając fakt, że poufne dane zostały usunięte z tego artykułu, aby przejść od zwykłego prognoz statystycznych do kradzieży tożsamości rzeczywistego atakująca musi wykorzystać otwory i słabości w USA tożsamości “infrastruktury:” powszechnej dostępności danych osobowych, demograficzne dla milionów osób, istnienie dużych botnety komputerów i techniki dopasowania i uwierzytelniania tożsamości lax przyjęte w sektorze kredytów/finansowe (między innymi). Nasze odkrycia mogą pomóc w walce i spadek kradzieży tożsamości pokazując, dlaczego takie znane (jeszcze zaniżone) słabości naszej tożsamości infrastruktury powinien wreszcie zająć się; przez ostrzegania przemysłu i decydentów nowy wykorzystać; i podkreślając konieczność porzucenia SSNs jako hasła i ruch w kierunku bardziej bezpieczne, efektywne i zachowania prywatności oznacza uwierzytelniania tożsamości.
Q. Czym różni się to od poprzedniego badania?
Wcześniejsze badania w dziedzinie SSNs koncentruje się na wykrywaniu SSNs w publicznych baz danych, za pomocą SSNs aby połączyć dane w wielu źródeł danych, lub w przypadku najbliżej naszego studium wnioskowanie roku [s] i państwa wydania znanego SSNs. Per se, istnienie SSN wystawiania wzorców jest znany SSA sprawia, że niektóre szczegóły dostępne materiały, i inni (w szczególności Latanya Sweeney i jej “SSN Watch”) używane tych wzorów, a także połączenie publicznych i prywatnych danych SSN, aby oszacować, kiedy i gdzie <known>SSN może zostały wydane [Wessmiller, 2002 r.], [Sweeney, 2004], [EPIC, 2008]. Jednak nasza praca skupia się na odwrotnej, trudniejsze i znacznie bardziej pośrednie wnioskowanie: to pokazuje, że jest możliwość wykorzystania podejrzewane o czas i miejsce wystawienia SSN do oszacowania, całkiem niezawodnie, <unknown>SSNs.
Pyt.: jakie dane trzeba przewidzieć SSN? Nie urodzenia danych jest trudne do zdobycia?
Dane o SSNs z tzw “śmierci głównego pliku,” który jest publicznie dostępne, i dane demograficzne (daty urodzenia i Państwa urodzenia) wszędzie tam, gdzie jest dostępny. Masy i ilości danych urodzenia dla mieszkańców USA mogą być uzyskane lub wywnioskować często za darmo, lub w nieznaczny na ceny jednostkowe z wielu źródeł danych handlowych w tym brokerów (takich jak www.peoplefinders.com, który sprzedaje dostęp do danych urodzenia oraz adresy prywatne dla ” prawie każdy dorosły w Stanach Zjednoczonych ”); rejestracji wyborców list (dla większości państw); wyszukiwanie online wolna ludzi (np. www.zabasearch.com); oraz serwisów społecznościowych: nasze szacunki wskazują, że co najmniej 10 milionów mieszkańców USA aby publicznie dostępnych lub inferable ich urodziny informacje na ich profile online.
Q. z którego serwisu społecznościowego dowiedziałeś danych dla jednego z testów?
Nie ma żadnych szczególnych serwisu społecznościowego, który jest wyjątkowo narażone. Dane mogą być pozyskiwane z kilka takich miejsc, jak również innych źródeł, jak wspomniano powyżej.
Pyt.: nie SSN w rzeczywistości jako dostępne jako data urodzenia?
One nie .
To prawda, że SSNs powszechnie dostępne. One zostały znalezione w publicznych rejestrów agencje federalne, Państwa, hrabstwa, sądy, szpitale, i tak dalej [prezes Identity Theft Task Force, 2007], a także w dokumentach osobistych, takich jak online CV [Sweeney, 2006]. Firm wymiany SSNs na rynkach danych osobowych i osób uzyskać raportów kredytowych,” zawierające ich SSNs, z biur kredytowych; kradzież SSNs lucratively wymieniane w podziemnych cybermarkets [Franklin, 2007]. GAO stwierdziła jednak, że tylko kilku pośredników oferujących SSNs do sprzedaży dla ogółu społeczeństwa rzeczywiście w stanie sprzedać cały SSNs [GAO, 2006]. Ponadto GAO znaleźć również, że chociaż jeszcze powszechne, SSNs coraz trudniej znaleźć w dokumentach publicznych [GAO, 2008]. W rzeczywistości liczba SSNs powszechnie dostępne również się zmniejsza z powodu licznych inicjatyw legislacyjnych w tej dziedzinie. Różne ostatnie inicjatywy koncentrują się na usunięcie SSNs z publicznej ekspozycji lub skracanie ich pierwsze pięć cyfr [NCSL, 2007 r.], [FKH, 2008], a [GAO, 2008]. Z drugiej strony narodziny danych pozostaje powszechnie dostępne, jak wspomniano powyżej.
Q. Czy można dokładnie przewidzieć, * co * SSN?
Nr.
Każdy SSN jest wydane w ramach tego samego systemu podstawowego zadania (i programu, a kompleks zawiera dostrzegalnych rasy). W związku z tym w teorii, mogą przewidzieć wszelkie SSN. Jednak prawdopodobieństwo, że danego SSN może być skutecznie przewidywane waha się od bardzo niskich (lub zero) na bardzo wysokim poziomie, w zależności od czynników takich jak rok i Państwa SSN został zastosowany do, jak blisko urodzenia osoby danych został zastosowany do i tak dalej. Za badania prowadził, nasze prognozy były kilka zamówień o wielkości bardziej dokładne niż losowość w 1973 przez okres 1988; Jednak dramatyczne i powszechny wzrost dokładności były szczególnie widoczne dla osób urodzonych po 1988 roku (początek Ogólnopolski program organu), szczególnie w mniej zaludnionych państw.
Pyt.: ile SSNs rzeczywiste można przewidzieć?
Tu jest nie jeden numer, który może odpowiedzieć na to pytanie. Numer jest funkcja wielu parametrów, i opóźnianie wniosków, w tym jak wspomniano wyżej dostępność danych urodzenia, dokładność przewidywania w różnych państwach i lat, dostępność narzędzia do sprawdzenia systemu i tak dalej. Prezentujemy kilka możliwości ekstrapolacji w dokumencie, ale podkreślamy, że muszą być ważone i zgodnie z zastrzeżenia również przedstawione tam.
P. umieszczone moją datę urodzenia w Internecie. Mój SSN zostało “złamane”?
Nr.
Że wiedzy nie jest wystarczające, aby “kompromis” SSN bez możliwości stara się znaleźć odpowiedni numer wśród możliwych wariantów oznacza to, że napastnicy nadal trzeba uda się wykorzystanie innych systemów do kompromisu własnej tożsamości. Ponownie prognoz statystycznych systemu windows można SSNs nie pociąga za sobą, sam, kradzieży tożsamości. Prawdopodobieństwo, że opóźnianie wniosków można tłumaczyć do identyfikacji rzeczywistych SSN jest funkcja wielu parametrów. Informacje niedokładne lub niedostępne urodzenia lub atakującej niezdolność do wykonania wielokrotnych prób, spowoduje zmniejszenie dokładności prognoz i liczba osób SSNs w rzeczywistych zagrożeń w porównaniu do DMF szacunki, które prezentujemy w dokumencie.
Pyt.: nie łamania danych większy problem?
Niekoniecznie chociaż to pomarańcze vs rodzaju jabłek porównania.
Po pierwsze: nie wszystkie naruszenia danych obejmują SSNs. szacunki oparte na danych attrition.org w czasie pisania wskazują, że średnia naruszenie obejmuje 140 k SSN rekordów. Jednak że średnia (a także większość największych naruszeń, które zaangażowane SSNs) obejmuje strat przypadkowych danych, które mogą nie doprowadziły do ekspozycji rzeczywistych informacji, takich jak rekordy 26.5 M U.S. weteranów przechowywane w laptopie podczas włamania w 2006.
Po drugie i ważniejsze, w przeciwieństwie do łamania danych, które lokalne zagrożenia (czyli specyficzne dla rekordów zawarte w niektórych bazy danych, jednak duże może być), przewidywalność możemy zaobserwować jest, w zasadzie, uniwersalny, że to dotyczy, teoretycznie (i z różny stopień dokładności, w zależności od czynników omówionych wyżej), obecnych i przyszłych SSNs chyba, że ich system przydziału jest modyfikowany.
Po trzecie: Firm można inwestować, aby chronić swoich baz danych, i złamanego karty kredytowe mogą być blokowane i odnowiona. Jednak w przeciwieństwie do tradycyjnych hasła, SSNs nie może być wciągnięty na czarną listę po nieudanych próbach, ani zmieniony aby uniknąć przyszłych nadużyć [SSA, 2009].
Po czwarte: łamania danych może być rozpoznana, i właścicieli kont zagrożone może być powiadamiany o naruszenie. Przewidywania SSNs jest bardziej podobny do “ukrycia” sposób utraty tożsamości i może być trudniejsze do wykrycia.
W związku z tym przewidywalność SSNs jest to problem, który należy do czynienia z różnymi narzędziami niż te używane do zapobiegania i radzenia sobie z łamania danych.
Q. czy nie taniej płacić tylko dane pośrednika do zdobycia SSN danych?
Niestety (a może na szczęście), nie.
W szarej, (która jest z wyłączeniem rynku gdzie kwalifikowanego i weryfikowane firm handlowych danych osobowych) staje się coraz bardziej trudne do uzyskania SSNs [GAO, 2006] i zbyt drogie: według [Krim, 2005]. SSNs sprzedawane na rynku szary ceny około $35$45. Na czarnym rynku zgodnie z [idanalytics, 2006 r.], kradzieży tożsamości w USA mogą być sprzedawane na rynku czarnego wartość z 30 dolarów do 50 dolarów za tożsamości. Jednakże szacunki wartości SSNs w podziemnych rynki różnią się znacznie (z niektóre szacunkowe znacznie mniejsze niż 30 dolarów), biorąc pod uwagę względny brak płynności rynków [McCarty, 2003], [Thomas, 2006] (począwszy od 0,10 dolarów do $25 (karty kredytowe) oraz pełną tożsamości (w tym SSNs) jako począwszy od 0.90 $ $25 [Herley, 2009]).
Na drugiej, narodziny dane niezbędne do przewidywania jest znacznie tańsze i dostępność botnety komputerów może zrobić zbioru poświadczenia na dużą skale dość łatwe (chociaż wahając się, kontrolujący 10.000 IPs na cały dzień może kosztować tak mało jak $1000 [Lesku, 2007]).
Pyt.: czy to nie przypadek, że SSNs, sam, nie wystarczające, aby podszyć się pod osobę? Banki i inne usługi poprosić o dodatkowe informacje (np. matka maiden imię, nazwa pet i tak dalej).
W USA, znajomość czyjeś imię, datę urodzenia i SSN kiedyś wystarcza do podszycia tej osoby w różnych sytuacjach.
Musimy odróżnić bieżących nadużyć (ktoś próbuje uzyskać dostęp do konta w banku został już utworzony) i nowe konto oszustwa (ktoś próbuje stworzyć nową kartę kredytową pod nazwą). Natomiast w rachunku bieżącego oszustwa atakujący, aby uzyskać dostęp do konta już stworzone i własnością jednostki, rzeczywiście potrzebuje nie tylko ofiary nazwa, data urodzenia, SSN, ale (najczęściej) również dodatkowe hasła i dane osobowe, w ” nowe konto ” oszustwa, atakujący więcej prawdopodobnie tylko trzeba użyć nazwy ofiary, daty urodzenia i SSN stworzyć nowe konto na imię ofiary. W związku z tym nowe konto oszustów można popełniane nawet bez wiedzy o numer telefonu ofiary, nazwisko panieńskie matki lub innych elementów danych osobowych. Montaż empirycznych dowodów sugeruje w rzeczywistości, że dostarczanie SSN i daty urodzenia, które odpowiadają tym SSN jest wystarczające do stworzenia nowych fałszywych kont [kucharz, 2005], [Hoofnagle, 2007 r.], [konsumentów Unii, 2007], nawet wtedy, gdy nazwa związane z SSN nie odpowiada, czy adres został źle, lub nawet jak wspomniano niektóre dodano cyfry SSN były błędne.
Poza tym dodając więcej pytań do uwierzytelnienia osoba do konta jest trudno dobre zabezpieczenia, jeśli odpowiedzi na te pytania może nadal wnioskować, lub zagrożone.
Pyt.: czy SSNs były już używane do uwierzytelniania, co jeszcze możemy wykorzystać?
Po prostu bardziej osobiste pytania (takich jak twoja matka nazwisko panieńskie, twój petâ € ™ s nazwa lub Twoje liceum) nie może działać, ponieważ te informacje można również zagrożone, skradziony lub w tym wieku procesie samoodkrywania wywnioskować z różnych źródeł. Jednak wiele badań koncentruje się na systemach, które chronią dane poufne, jednocześnie umożliwiając wymianę informacji: praca na 2-czynnik uwierzytelniania certyfikatów cyfrowych i prywatności zachowania tożsamości systemów zarządzania. Chociaż nie jest niezawodny system ani panaceum (jako Bruce Schneier zauważyć, “proponowane poprawki raczej skoncentrować się na […] co trudniejsze do kradzieży – danych osobowych, zważywszy, że prawdziwym problemem jest […] zapobiegania i wykrywania fałszywych transakcji”[Schneier, 2007]), badania w tej dziedzinie dokonała znacznego postępu w ostatnich latach, i mamy nadzieję, że debata będzie koncentrować się na systemach, które łączą prywatność z niezbędnych i skuteczny przepływ informacji.
P: kto finansowane badania?
National Science Foundation (w ramach dotacji 0713361) i US Army badań Biuro (zgodnie z umową DAAD190210389, przez Carnegie Mellon w CyLab). Otrzymaliśmy również wsparcie z Funduszu Berkman Carnegie Mellon i od centrum superkomputerów Pittsburgh.
Q. były IRB zatwierdzonych testów?
Tak, one zostały zatwierdzone. SSNs nie zostały naruszone w czasie pisania tego dokumentu.

Comments are closed.