The AIDA Dataset Register  »  AIDA Data Sharing Policy

This section holds suggestions on language that can be used in ethical review applications to support data sharing in medical imaging diagnostics.

These phrases are all taken out of their respective contexts where they describe circumstances and appropriate protective measures in their respective research activities. They are not intended to be used as-is, but likely need to be adapted to specific circumstances in new ethical review applications.

Researchers are welcome to contact AIDA with any questions relating to this matter.

Contents:

Applying for ethical review

An approved ethical review application defines the framework for what is allowed activities in most research on humans and personal data. Some of the sections are relevant for data sharing. The Legal discussion section has legal/ethical context around this. Applications are submitted to the Swedish Ethical Review Authority (“etikprövningsmyndigheten”, EPM). The mechanisms for submission have varied. At the time of writing an online processing system is being replaced, so in the interim forms for manual processing. Applications to EPM are processed in Swedish.

Examples

Examples translated to English are available below. Note that applications to Swedish EPM are processed in Swedish.

Relevanta avdelningar

Datamängder

“Den statistiska styrkan avgör det förväntade antalet signifikanta resultat och är relaterad till sannolikheten att ett visst signifikant resultat reflekterar en sann effekt. Inom OMRÅDE vet vi nu att om vi ökar antalet patienter med N nya fall, så leder det till U-V nya signifikanta fynd. Om vi dubblerar storleken på TIDIGARE_STUDIE, så bör vi då identifiera X-Y nya MÖJLIGA_ORSAKER till SJUKDOM, vilket skulle innebära ett viktigt bidrag med ny kunskap om den underliggande etiologin bakom SJUKDOM.”

“Antalet bilder som kommer att extraheras relateras till den power och relevans som avses per studie och vi önskar kunna göra ett bra randomiserat urval varför antalet tar höjd för STORT_ANTAL bilder baserat på den digitala 5 årsproduktion som finns i det digitala arkivet (totalt cirka VÄSENTLIGT_STÖRRE_ANTAL bilder).”

“Många sätter idag sin tilltro till att olika stödsystem baserade på artificiell intelligens (AI) ska kunna erbjuda OMRÅDE en hjälp att både effektivisera och förbättra kvalitéten i YRKESVERKSAMMAS arbete. En utmaning i sammanhanget är att den träningsdata som behövs för att utveckla AI-system för dessa syften är kraftigt begränsad, om ens tillgänglig. Detta projekt syftar till att utveckla och publicera en öppen bilddatabas innehållande detaljerade annoteringar för träning av AI-system till stöd för den bilddiagnostik som genomförs av YRKESVERKSAMMA i samband med diagnos och uppföljning av patienter inom OMRÅDE.”

Riskminimering

Sekretess

“Alla nyanställda på HUVUDMAN skriver på avtal om sekretess och tystnadsplikt.”

“Personal som kommer i kontakt med data ger skriftlig försäkran att inte i något sammanhang bryta sekretessbestämmelser.”

Ansvar och kompetens

“NAMNGIVEN_FORSKARE, ROLL vid HUVUDMAN, har ansvaret för forskningspersonernas säkerhet, vilket i detta projekt innebär att resurser finns för att hantera projektet enligt plan med avseende på anonymisering och säkerhet etc. Se intyg i BILAGA.”

“Forskningen genomförs under ansvar av prefekten vid INSTITUTION, HUVUDMAN. Vid INSTITUTION finns nödvändiga resurser och expertis för att säkerställa forskningspersonernas säkerhet och integritet (datasekretess) samt forskningsprojektets genomförande, se BILAGA”

“Deltagarnas integritet skyddas utifrån ett strukturerat informationssäkerhetsarbete enligt ISO 27000. Detta innebär att arbetet styrs av policies, riktlinjer samt ett medvetande hos personalen.”

Åtkomstbegränsning

“Inga obehöriga äger tillträde till lokalerna (passerkort och kod) där data och material lagras. För HUVUDMANs lokaler gäller särskild behörighet.”

“Ingen data lagras lokalt. All data lagras centralt i en serverhall vid HUVUDMAN. Serverhallen skyddas enligt gängse normer för skalskydd. Alla uppkopplingar till den centrala serverhallen sker via krypterade kommunikationsförbindelser.”

Begränsning till mindre känsliga datatyper

“Data som beskriver YRKESVERKSAMMAS arbetssätt kommer att samlas in. Dessa kommer att vara tillgängliga bara för forskare i projektet och bara publiceras i anonym form.”

Begränsning till enbart data

“Inga avvikelser från klinisk rutin eller ordinarie behandling kommer att ske inom projektet.”

Angående tidigare erfarenheter av den använda behandlingen: “Ej relevant, eftersom projektet inte direkt kommer leda till någon ändring eller något tillägg till patienternas vård.”

Deltagande i flera projekt

“Eftersom vår studie är en observationell studie och inte en interventionsstudie, så löper inte forskningspersonerna större risker om denna observationsstudie kombineras med en annan forskningstudie.”

“Flera studier kan utnyttja data från projektet men forskningspersonerna påverkas inte av detta eftersom dessa studier inte medför förnyad kontakt med deltagarna.”

“Ej relevant, forskningspersonerna löper ingen risk genom att vara del av detta projekt, varför kombinationseffekter med andra projekt inte kommer uppstå.”

Teknik

“Krypteringsnycklar skickas separat och med oberoende överföringsmetod.”

Länkad data från flera källor

“Data kommer skickas med personnummer från DATAKÄLLOR och länkas, varefter data kommer pseudonymiseras.”

“Personnummer måste behållas under datainsamlingsdelen av studien och därefter kommer bilderna och hela databasen att pseudonymiseras.”

Pseudonym data

“Alla data kommer att pseudonymiseras och ges slumpmässiga kodnummer, som inte kan kopplas till personernas identitet. Kodnyckel som kopplar samman kod till personers identitet kommer endast att finnas vid HUVUDMAN.”

“Lagringen av data sker så att enskilda individer ej är identifierbara annat än av forskargruppen.”

“Skriftliga dokument förvaras låsta och med kodnummer.”

“Databaserad information kopplas till kodnummer och kan inte avslöja personernas identitet.”

“Resultaten sammanställs i tabeller där inga enskilda individer kan identifieras.”

“Pseudonyma uppgifter SPECIFIKATION kommer lagras i DATABAS eller liknande inom EU/EES och i enlighet med GDPR. Data i denna databas kommer att kunna användas och analyseras av forskargrupper i Sverige och utomlands. För att få tillgång till data måste forskare ansöka om ett uttag och beskriva hur data ska användas (vilket måste vara i linje med denna ansökan).”

“Säkerheten garanteras genom att deltagaren loggar in med e-legitimation (BankID) samt att säkra datorprotokoll (https) används.”

“Avidentifierade data kommer att analyseras av ansvarig forskare samt medverkande forskare.”

“Pseudonymiseringsnyckeln kommer krypteras och förvaras hos HUVUDMAN, åtkomligt enbart för senior ledning i forskningsprojektet. Tillhörande krypteringsnyckel kommer förvaras inlåst i kassaskåp hos HUVUDMAN. Data i pseudonym form kommer att behandlas och delas på system avsedda för behandling av känsliga personuppgifter i enlighet med GDPR, och kommer sparas för att möjliggöra forskningsvalidering. Pseudonym data som ej längre behövs kommer att anonymiseras eller gallras. Data i anonym form kommer att publiceras och delas för att möjliggöra vidare beforskning.”

“Data i pseudonym form kommer att behandlas och delas på lokala IT-system enligt HUVUDMANs rutiner, och på nationella system speciellt konstruerade för behandling av känsliga personuppgifter i forskningssyfte i enlighet med GDPR, såsom SNIC-SENS Bianca.”

“Om andra forskare vill granska datat och reproducera resultaten kommer de erbjudas tillgång till pseudonym eller anonym data under icke-spridningsavtal, antingen på plats vid HUVUDMAN eller med hjälp av nationella system speciellt konstruerade för behandling av känslig persondata för forskning i enlighet med GDPR.”

“Vid presentation av resultat kommer dessa att vara avidentifierade och om individuella resultat presenteras kommer dessa inte vara kopplade till identifierbar information. Resultaten kommer huvudsakligen redovisas på aggregerad nivå.”

Anonym data

“Patienterna informeras ej om forskningsprojektet. De ansökande forskarna drar slutsatsen att detta inte behövs, eftersom personuppgifter inte hanteras.”

“Samtycke inhämtas inte från patienterna. De ansökande forskarna drar slutsatsen att detta inte behövs, eftersom personuppgifter inte hanteras.”

“Projektet medför inga risker för deltagarna. Patienterna påverkas inte av projektet.”

“Projektet tillför ingen direkt nytta för forskningspersonerna. Patienterna påverkas inte av projektet. Yrkesverksamma deltagare får inte direkt nytta, men kan i framtiden dra nytta av resultat i form av förbättrade verktyg och arbetssätt.”

“Inga etiska problem. Förhoppningsvis kan forskningen indirekt leda till förbättrad framtida vård.”

Angående forskningspersonernas rätt till integritet: “Ej relevant för patienterna. Personuppgifter från patienterna kommer aldrig behandlas i forskningen eftersom första steget är full anonymisering.”

“Insamlingen och avidentifieringen kommer att ske genom en halvautomatisk procedur. En behörig individ kommer sköta insamlingen inom sjukhusets nätverk. Därefter kommer avidentifiering ske automatiskt, varpå data kommer att lagras, under lösenordsskydd, och sedan göras tillgängligt för forskare i projektet. De ansökande forskarna drar slutsatsen att detta tillvägagångssätt innebär att projektets insamlade data från patienter inte utgör personuppgifter i lagens mening eller är integritetskänsliga och därmed inte berörs av etikprövning.”

“Ansökan gäller huvudsakligen data som samlats in på klinik av medicinska skäl, oberoende av forskningsstudien. Projektet hanterar inte personuppgifter från patienter, dvs data kan inte härröras tillbaka till forskningspersonerna. Således kan projektet inte påverka patienterna på något sätt, och därför inte heller påverka deras säkerhet.”

“Data kommer att avidentifieras på sådant sätt att informationen inte kan återföras till den individ det härstammar från. Information såsom namn, personnummer och telefonnummer kommer att avlägsnas alternativt ersättas med genererad data. Även indirekt identifierande information, så som remiss- och undersökningsnummer kommer att avlägsnas eller ersättas.”

“Data extraheras ur det kliniska IT-systemet genom en automatisk procedur. Ett automatiskt program kommer inom sjukhusets nätverk att sköta detta, inklusive all anonymisering. Data kommer sedan att lagras anonymiserade. Anonymiserade bilddata kommer sedan att berikas med medicinska metadata, framför allt i form av annoteringar från medicinska experter över olika vävnadstyper och sjukdomsuttryck.”

“Anonymiserade data avses att publiceras och göras tillgänglig för andra forskare inom området för att ge möjlighet till reproduktion av studien och därmed öka validiteten av metoden, och även för att ge möjlighet till deras egen forskning inom till exempel utveckling av bildanalysapplikationer.”

“Dataskydd är ej relevant, då projektet inte hanterar personuppgifter från patienter eller känsliga uppgifter om medverkande yrkesverksamma.”

“Samtliga forskare har tillgång till data och kommer alla bidra till databearbetning och publikationer, under huvudansvarig forskares ansvar.”

Examples translated to English

This is a non-professional translation to English of original phrases in Swedish, provided for the benefit of non-Swedish speaking readers. Please note that these phrases address evaluation criteria defined by the Swedish national ethical review authority based on circumstances in Sweden, and that criteria and circumstances may be different in other countries.

Relevant sections

Amounts of data

“The statistical power determines the expected number of significant results and is related to the probability that a certain significant result reflects a true effect. In AREA we now know that if we increase the number of patients with N new cases, it will lead to U-V new significant findings. If we double the size of PREVIOUS_STUDY, then we should identify X-Y’s new POSSIBLE_ CAUSES of DISEASE, which would make an important contribution with new knowledge of the underlying etiology behind DISEASE.”

“The number of images that will be extracted is related to the power and relevance referred to per study and we wish to be able to make a high quality randomized selection, which is why the number BIG_NUMBER images includes a margin based on the digital 5 year production now existing in the digital archive (a total of approximately MUCH_BIGGER_NUMBER).”

“Today many place their trust in the fact that various support systems based on artificial intelligence (AI) will be able to offer AREA help both to streamline and improve the quality of the work of PROFESSIONALS. One challenge in this context is that the training data needed to develop AI systems for these purposes are greatly limited, if at all available. This project aims to develop and publish an open image database containing detailed annotations for training of AI systems to support imaging diagnostics by PROFESSIONALS in connection to diagnosis and follow-up of patients in AREA. “

Risk minimization

Confidentiality

“All new employees at RESEARCH_INSTITUTION sign agreements on non-disclosure and confidentiality.”

“Personnel who come into contact with data provide written assurances that they in no context will breach confidentiality provisions.”

Responsibility and competence

“NAMED_ RESEARCHER, ROLE at RESEARCH_INSTITUTION, is responsible for the safety of the research subjects, which in this project means that resources are available to manage the project according to plan with regard to anonymization and security etc. See certificate in ANNEX.”

“The research is carried out under the responsibility of the head of the DEPARTMENT, RESEARCH_INSTITUTION. The DEPARTMENT has the necessary resources and expertise to ensure the safety and integrity of the research subjects (data confidentiality) and the implementation of the research project, see ANNEX”

“The integrity of the participants is protected on the basis of a structured information security work in accordance with ISO 27000. This means that the work is guided by policies, guidelines and staff awareness.”

Access restrictions

“No unauthorized person has access to the premises (access card and code) where data and materials are stored. Special access rights apply to DEPARTMENT premises. “

“No data is stored locally. All data is stored centrally in a server room at RESEARCH_INSTITUTION. The server room is protected according to common standards for perimeter protection. All connections to the central server room are encrypted.”

Limitation to less sensitive data types

“Data describing the working methods of PROFESSIONALS will be collected. These will only be available to researchers in the project and will only be published in anonymous form.”

Limitation to only data

“No deviations from clinical routine or regular treatment will occur within the project.”

Regarding past experiences of the treatment used: “Not relevant, as the project will not directly lead to any change or addition to patient care.”

Participation in multiple projects

“Because our study is observational and not an intervention study, the research subjects are not at increased risk if this observational study is combined with another research study.”

“Several studies can utilize data from the project, but the research subjects are not affected by this because these studies do not entail renewed contact with the participants.”

“Not relevant. The research subjects are not at risk by being part of this project, so combination effects with other projects will not occur.”

Technology

“Encryption keys are sent separately and with an independent transfer method.”

Linked data from several sources

“Data will be sent with social security numbers from DATA_SOURCES and linked, after which data will be pseudonymized.”

“Social security numbers must be retained during the data collection part of the study, after which the images and the entire database will be pseudonymized.”

Pseudonymous data

“All data will be pseudonymized and given random code numbers which cannot be linked to individual identities. The key linking codes to individuals will be stored only at the RESEARCH_INSTITUTION.”

“The data is stored such that individuals are not identifiable other than by the research team.”

“Written documents are stored locked and with code numbers.”

“Database information is linked to code numbers and cannot reveal individual identities.”

“The results are compiled in tables where no individual can be identified.”

“Pseudonymous data SPECIFICATION will be stored in DATABASE or similar within EU / EEA and in accordance with GDPR. Data in this database will be used and analyzed by research groups in Sweden and abroad. To access data, researchers must then apply for data to be disclosed, therein describing how data will be used (which must be in line with this application). “

“Security is guaranteed by participant login with e-identification (BankID) and using secure protocols (https).”

“Unidentified data will be analyzed by responsible researchers as well as contributing researchers.”

“The pseudonymization key will be encrypted and stored at HUVUDMAN, accessible only to senior management in the research project. The associated encryption key will be stored locked in safes at HUVUDMAN. Data in pseudonymous form will be processed and shared on systems intended for processing sensitive personal data for research in compliance with GDPR, and will be stored to enable research validation. Pseudonymous data that is no longer needed will be anonymized or deleted. Data in anonymous form will be published and shared to enable further research.”

“Data in pseudonymous form will be processed and shared on local IT systems according to HUVUDMAN’s routines, and on national systems specially designed for processing sensitive personal data for research purposes in accordance with GDPR, such as SNIC-SENS Bianca.”

“If other researchers want to review the data and reproduce the results, they will be offered access to pseudonymous or anonymous data under non-disclosure agreements, either on site at HUVUDMAN or using national systems specifically designed for processing sensitive personal data for research in accordance with GDPR.”

“When presenting results, these will be unidentified, and if individual results are presented, they will not be linked to identifiable information. The results will mainly be reported at an aggregated level.”

Anonymous data

“Patients are not informed about the research project. The applicant researchers conclude that this is not needed, since personal data is not processed.”

“Consent is not obtained from the patients. The applicant researchers conclude that this is not needed, since personal data is not processed.”

“The project does not subject participants to risk. The patients are not affected by the project.”

“The project brings no direct benefit to the research subjects. Patients are not affected by the project. Professional participants will not benefit directly, but may in the future benefit from results in the form of improved tools and working methods.”

“No ethical problems. Hopefully, research can indirectly lead to improved future care.”

Regarding the data subjects’ right to privacy: “Not relevant to patients. Personal data from patients will never be processed in research because the first step is full anonymization.”

“The collection and de-identification will be done through a semi-automatic procedure. An authorized person will manage the collection within the hospital network. Thereafter, de-identification will be done automatically, whereupon data will be stored, under password protection, and then made available to researchers in the project. The applicant researchers draw the conclusion that this approach means that the data processed in the project, though originally collected from patients, does not constitute personal data in the sense of the law or is sensitive to integrity, and is thus not affected by ethical review. “

“The application mainly applies to data collected at the clinic for medical reasons, regardless of the research study. The project does not handle personal data from patients, ie data cannot be traced back to the data subjects. Thus, the project can not affect patients in any way, and therefore does not affect their security.”

“Data will be de-identified in such a way that the information cannot be traced back to the individual from which it originated. Information such as name, social security number and telephone number will be removed or replaced with generated data. Indirectly identifying information, such as referral and examination numbers will also be removed or replaced. “

“Data is extracted from the clinical IT system through an automatic procedure. An automated program will handle this within the hospital network, including all anonymization. Data will then be stored anonymously. Anonymized image data will then be enriched with medical metadata, especially in the form of annotations by medical experts on various tissue types and disease manifestations. “

“Anonymized data is intended to be published and made available to other researchers in the field to provide the opportunity for reproduction of the study and thereby increase the validity of the method, and also to provide the opportunity for their own research in, for example, the development of image analysis applications.”

“Data protection is not relevant, as the project does not handle personal data from patients or sensitive information about participating professionals.”

“All researchers have access to data and will all contribute to data processing and publications, under the supervision of the named competent researcher.”