five

NeMig - A Bilingual News Collection and Knowledge Graph about Migration

收藏
NIAID Data Ecosystem2026-05-01 收录
下载链接:
https://zenodo.org/record/7442424
下载链接
链接失效反馈
官方服务:
资源简介:
NeMig represents a bilingual news collection and knowledge graphs on the topic of migration. The news corpora in German and English were collected from online media outlets from Germany and the US, respectively. NeMIg contains rich textual and metadata information, sentiment and political orientation annotations, as well as named entities extracted from the articles' content and metadata and linked to Wikidata. The corresponding knowledge graphs (NeMigKG) built from each corpus are expanded with up to two-hop neighbors from Wikidata of the initial set of linked entities. NeMigKG comes in four flavors, for both the German, and the English corpora: Base NeMigKG: contains literals and entities from the corresponding annotated news corpus; Entities NeMigKG: derived from the Base NeMIg by removing all literal nodes, it contains only resource nodes; Enriched Entities NeMigKG: derived from the Entities NeMig by enriching it with up to two-hop neighbors from Wikidata, it contains only resource nodes and Wikidata triples; Complete NeMigKG: the combination of the Base and Enriched Entities NeMig, it contains both literals and resources. Information about uploaded files: (all files are b-zipped and in the N-Triples format.) A description of the NeMigKG files is provided in the table below: NeMigKG Files Description File Description nemig_${language}_ ${graph_type}-metadata.nt.bz2 Metadata about the dataset, described using void vocabulary. nemig_${language}_ ${graph_type}-instances_types.nt.bz2 Class definitions of news and event instances. nemig_${language}_ ${graph_type}-instances_labels.nt.bz2 Labels of instances. nemig_${language}_ ${graph_type}-instances_related.nt.bz2 Relations between news instances based on one another. nemig_${language}_ ${graph_type}-instances_metadata_literals.nt.bz2 Relations between news instances and metadata literals (e.g. URL, publishing date, modification date, sentiment label, political orientation of news outlets). nemig_${language}_ ${graph_type}-instances_content_mapping.nt.bz2 Mapping of news instances to content instances (e.g. title, abstract, body). nemig_${language}_ ${graph_type}-instances_topic_mapping.nt.bz2 Mapping of news instances to sub-topic instances. nemig_${language}_ ${graph_type}-instances_sentiment_mapping.nt.bz2 Mapping of news instances to sentiment classes. emig_${language}_ ${graph_type}-instances_political_orientation_mapping.nt.bz2 Mapping of news outlets instances to political orientation classes. nemig_${language}_ ${graph_type}-instances_content_literals.nt.bz2 Relations between content instances and corresponding literals (e.g. text of title, abstract, body). nemig_${language}_ ${graph_type}-instances_sentiment_polorient_literals.nt.bz2 Relations between instances and corresponding sentiment or political orientation literals. nemig_${language}_ ${graph_type}-instances_metadata_resources.nt.bz2 Relations between news or sub-topic instances and entities extracted from metadata (i.e. publishers, authors, keywords). nemig_${language}_ ${graph_type}-instances_event_mapping.nt.bz2 Mapping of news instances to event instances. nemig_${language}_ ${graph_type}-event_resources.nt.bz2 Relations between event instances and entities extracted from the text of the news (i.e. actors, places, mentions). nemig_${language}_ ${graph_type}-resources_provenance.nt.bz2 Provenance information about the entities extracted from the text of the news (e.g. title, abstract, body). nemig_${language}_ ${graph_type}-wiki_resources.nt.bz2 Relations between Wikidata entities from news and their k-hop entity neighbors from Wikidata.                                     The corresponding user data has been collected through online studies in Germany and the US. We used the participants' implicit feedback regarding their interest in an article to build their click history, and the explicit feedback in terms of news click behaviors to construct the impression logs. To protect user privacy, we assign each user an anonymized ID. The German and English user datasets are zip-compressed folders, which contain two files each. NeMig User Dataset File Description File Description behaviors.tsv The click history and impression logs of users. demographics_politics.tsv Demographic and political information of users. The behaviors.tsv file contains the users' news click histories and the impression logs. It has 4 columns divided by the tab symbol: Impression ID: the ID of an impression. User ID: The anonymized ID of an user. Click History: The news click history (list of news IDs) of a user before an impression. Impression Log: List of news displayed to the user in a session and the user's click behavior on them (1 for click, 0 for non-click). The demographics_politics.tsv file contains detailed information about the users' demographics and political interests. It has columns divided by the tab symbol. An explanation of all the columns and the questions used in the online studies to collect this information is shown in the table below. Demographic and political user data description Column Name Question in German study Scale in German Question in English study Scale in English Demographics         Gender Bitte geben Sie Ihr Geschlecht an 0 = männlich 1 = weiblich 2 = divers 3 = Keine Angabe Please indicate your gender. 0 = male 1 = female 2 = other 3 = no answer Age Bitte geben Sie Ihr Alter an     1-120 Please indicate your age. 1-120 Qualification Welches ist Ihr höchster Bildungsabschluss? 0 = Kein Schulabschluss 1 = Haupt-/Gesamtschulabschluss 2 = Realschulabschluss, Mittlere Reife, Fachschulreife 3 = Fachhochschulreife, Abitur 4 = Studium mit Abschluss 5 = Promotion 6 = Keine Angabe Please indicate your highest educational qualification. 0 = less than high school 1 = high school/GED 2 = Vo-tech/business school 3 = some college 4 = college degree 5 = university degree 6 = doctoral degree 7 = no answer Nationality Welche Staatsangehörigkeit besitzen Sie? 0 = Nur die deutsche Staatsangehörigkeit 1 = Die deutsche und eine andere Staatsangehörigkeit 2 = Nur eine andere Staatsangehörigkeit 3 = Keine Angabe What is your citizenship? 0 = U.S. citizenship 1 = U.S. and another non-U.S. citizenship 2 = Only non-U.S. citizenship 3 = No Answer BornIn Sind Sie in Deutschland geboren? 0 = Ja 1 = Nein 2 = Keine Angabe Were you born in the U.S.? 0 = Yes 1 = No 2 = No answer ParentsBornIn Sind Ihre Eltern in Deutschland geboren? 0 = Mein Vater und meine Mutter sind beide in Deutschland geboren 1 = Mein Vater ist in Deutschland geboren, meine Mutter nicht 2 = Meine Mutter ist in Deutschland geboren, mein Vater nicht 3 = Weder meine Mutter noch mein Vater sind in Deutschland geboren 4 = Keine Angabe Were your parents born in the U.S.? 0 = My father and my mother were both born in the U.S. 1 = My father was born in the U.S., my mother was not 2 = My mother was born in the U.S., my father was not 3 = Neither my mother nor my father were born in the U.S 4 = No answer Income Was ist Ihr persönliches monatliches Nettoeinkommen (nach Abzug der Steuern)? Bitte geben Sie eine ungefähre Schätzung an, falls Sie die genaue Zahl nicht kennen. 0 = Weniger als 1000 € 1 = 1001 € bis 2000 € 2 = 2001 € bis 3000 € 3 = 3001 € bis 4000 € 4 = 4001 € bis 5000 € 5 = Mehr als 5000 € 6 = Keine Angabe What is your personal monthly net income (after taxes)? Please give an approximate estimation in case you are unsure. 0 = Less than 1000 $ 1 = 1001 $ to 2000 $ 2 = 2001 $ to 3000 $ 3 = 3001 $ to 4000 $ 4 = 4001 $ to 5000 $ 5 = More than 5000 $ 6 = No Answer Empathy Wie sehr stimmen Sie den folgenden Aussagen zu? 7-point Likert scale 1=Trifft überhaupt nicht zu 7=Trifft voll und ganz zu How strongly do you agree with the following statements? 7-point Likert scale 1=Strongly disagree 7=Strongly agree EMP1 Wenn jemand anderes erfreut ist, tendiere ich dazu auch erfreut zu sein.   When someone else is feeling excited, I tend to get excited too.   EMP2 Es regt mich auf, wenn jemand respektlos behandelt wird.   It upsets me to see someone being treated disrespectfully.   EMP3 Es macht mir Freude, andere aufzumuntern.   I enjoy making other people feel better.   EMP4 Ich bin besorgt um Personen, die weniger Glück haben als ich.   I have tender, concerned feelings for people less fortunate than me.   EMP5 Ich fühle, wenn andere traurig sind, selbst wenn sie nichts sagen.   I can tell when others are sad even when they do not say anything.   EMP6 Meistens bin ich mit den Stimmungen anderer Leute im Einklang.   I find that I am “in tune” with other people’s moods.   EMP7 Ich empfinde einen starken Drang zu helfen, wenn ich jemanden sehe, der aufgebracht ist.   I get a strong urge to help when I see someone who is upset.   EMP8 Wenn ich jemanden sehe, der ausgenutzt wird, möchte ich die Person beschützen.   When I see someone being taken advantage of, I feel kind of protective towards him\her.   Big5 Ich bin... 7-point Likert scale 0 = Sehr 1 = Ziemlich 2 = Etwas 3 = Teils=Teils 4 = Etwas 5 = Zeimlich 6 = Sehr I see myself as... 7-point Likert scale 1=Strongly disagree 7=Strongly agree BIG1 extrovertiert -- introvertiert   ...extroverted, enthusiastic   BIG2 emotional -- ausgeglichen   ...critical, quarrelsome   BIG3 aufgeschlossen -- festgelegt   ...dependable, self-disciplined   BIG4 barsch -- umgänglich   ...anxious, easily upset   BIG5 gewissenhaft -- nachlässig   ...open to new experiences, complex   BIG6 -   ...reserved, quiet   BIG7 -   ...sympathetic, warm   BIG8 -   ...disorganized, careless   BIG9 -   ..calm, emotionally stable   BIG10 -   ...conventional, uncreative   Ideological Polarization Im Folgenden sehen Sie eine Reihe von gegensätzlichen Aussagen. Bitte geben Sie jeweils an, wie sehr Sie der Aussage zustimmen oder diese ablehnen. Es gibt keine richtigen oder falschen Antworten. 7-point Likert scale 0 = Sehr 1 = Ziemlich 2 = Etwas 3 = Teils=Teils 4 = Etwas 5 = Zeimlich 6 = Sehr In the following, you will see a series of opposing statements. Please indicate how strongly you agree or disagree with the statements. There are no right or wrong answers. 7-point Likert scale 1=Strongly disagree 7=Strongly agree IPO1 Deutschland sollte mehr Geflüchtete aufnehmen.   The U.S. should take in more refugees.   IPO2 Deutschland hat schon zu viele Flüchtlinge aufgenommen.   The U.S. should take in more refugees.   IPO3 Deutschland sollte sich für sichere und einfache Fluchtwege nach Europa einsetzen.   The U.S. should advocate safe and easy escape routes to North America.   IPO4 Deutschland sollte sich dafür einsetzen, dass Flüchtlinge nicht einfach nach Europa kommen können.   The U.S. should work to ensure that refugees cannot easily come to North America.   IPO5 Immigranten bemühen sich um ein friedliches Zusammenleben mit Deutschen.   Immigrants strive for peaceful cohabitation with U.S.-Americans.   IPO6 Immigranten treten den Deutschen feindselig gegenüber.   Immigrants are hostile toward U.S.-Americans.   IPO7 Immigranten wollen auf Kosten des deutschen Wohlstands leben.   Immigrants want to live at the expense of U.S.-American prosperity.   IPO8 Immigranten helfen dabei, den deutschen Wohlstand zu sichern.   Immigrants help in securing U.S.-American prosperity.   IPO9 Immigranten bedrohen die deutsche Kultur und Lebensweise.   Immigrants threaten the U.S.-American culture and lifestyle.   IPO10 Immigranten bereichern die deutsche Kultur und Lebensweise.   Immigrants enrich the U.S.-American culture and lifestyle.   IPO11 Immigranten sind krimineller und gewalttätiger als Deutsche.   Immigrants are more criminal and more violent than U.S.-Americans.   IPO12 Immigranten sind nicht krimineller oder gewalttätiger als Deutsche.   Immigrants are not more criminal and violent than U.S.-Americans.   Emotions Welche Emotionen empfinden Sie gegenüber Geflüchteten und Immigranten in Deutschland? 7-point Likert Scale 1 = Stimme überhaupt nicht zu 7 = Stimme voll zu Which emotions do you feel towards refugees and immigrants in the USA? 7-point Likert Scale 1=Strongly disagree 7=Strongly agree EMO1 Wut   Anger   EMO2 Angst   Fear   EMO3 Verachtung   Contempt   EMO4 Trauer   Grief   EMO5 Ekel   Disgust   EMO6 Neid   Envy   EMO7 Schadenfreude   Gloat   EMO8 Mitleid   Pity   EMO9 Mitgefühl   Compassion   EMO10 Bewunderung   Admiration   EMO11 Freude   Joy   EMO12 Hoffnung   Hope   EMO13 Dankbarkeit   Gratitude   EMO14 Ehrfurcht   Awe   Media Usage Informationen über die deutsche Politik bekomme ich aus/von: 7-point Likert Scale 1=Nie 7=Sehr häufig I receive information about US-American politics via: 7-point Likert Scale 1=Never 7=Very Often MED1 Zeitungen und Magazinen oder deren Internet-Angeboten (z.B. BILD-Zeitung/ bild.de, Der Spiegel/spiegel.de, ...)       newspapers and magazines or their websites (e.g. New York Times, The Wallstreet Journal, ...)   MED2 dem Fernsehen oder deren Internet-Angeboten (z.B. ARD/ard.de, RTL /rtl.de, ...)   TV networks or their websites (e.g. Fox News, CNN... )   MED3 dem Radio deren Internet-Angeboten (z.B. Energy/energy.de, Deutschlandfunk/deutschlandfunk.de, …)       radio stations or their websites (e.g. WHTZ-FM, KIIS-FM, … )   MED4 Facebook (zur politischen Information)   Facebook (for political information)   MED5 Twitter (zur politischen Information)   Twitter (for political information)   MED6 Instagram (zur politischen Information)   Instagram (for political information)   MED7 Messenger Diensten wie z.B. WhatsApp und Telegram (zur politischen Information)   messenger services such as WhatsApp or Telegram (for political information)   MED8 YouTube (zur politischen Information)   YouTube (for political information)   MED9 Politischen Blogs und/oder speziellen Nachrichtenanbietern, die es nur im Internet gibt   political blogs and/or alternative news providers, which can only be found online   Participation Können Sie sich vorstellen, in naher Zukunft… 7-point Likert Scale 1=Kann ich mir gar nicht vorstellen 7=Kann ich mir gar nicht vorstellen Please indicate how likely it is that you will engage in the following activities in the near future. 7-point Likert Scale 1=Not likely at all 7=Very likely PPA1 … an einer politische Onlinediskussion zum Thema Immigration in Deutschland teilzunehmen?   Participating in an online political discussion on the topic of immigration to the U.S.   PPA2 … eine politische Onlinepetition zum Thema Immigration in Deutschland zu unterschreiben?   Signing an online political petition on the topic of immigration to the U.S.   PPA3 … eine/n Politiker/in in Deutschland zum Thema Immigration mit einer E-Mail oder über Social Media zu kontaktieren?   Contacting a U.S.-American politician on the topic of immigration via e-mail or social media.   PPA4 … einer politischen Partei oder Gruppe auf Social Media zu folgen, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Following a party or group on social media, that is particularly engaged in the field of immigration to the U.S.   PPA5 … einer politischen Partei oder Gruppe Geld zu spenden, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Donating money to a political party or group that is especially involved in the field of immigration to the U.S.   PPA6 … an einer politischen Demonstration zum Thema Immigration in Deutschland teilzunehmen?   Participating in a political demonstration on the topic of immigration to the U.S.   PPA7 … einer politischen Partei oder einer Gruppe beizutreten, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Joining a political party or group that is especially involved in the field of immigration to the U.S.   PPA8 … für eine politische Partei, oder einer Gruppe Freiwilligenarbeit zu leisten, die sich besonders im Themenfeld Immigration in Deutschland engagiert?   Volunteering for a political party or group that is especially involved in the field of immigration.   Perceived Polarization Wie bewerten Sie folgende Aussagen? 7-point Likert Scale 1 = Stimme überhaupt nicht zu 7 = Stimme voll zu How strongly do you agree or disagree with the following statements? 7-point Likert Scale 1=Strongly disagree 7=Strongly agree PRO1 Die Anhänger der verschiedenen politischen Parteien in Deutschland stehen sich immer feindseliger gegenüber.   Democratic and Republican partisans in the U.S. are increasingly hostile to one another.       PRO2 Die Anhänger der verschiedenen politischen Parteien in Deutschland haben sich immer weniger zu sagen.   There is less and less common meeting ground between Democratic and Republican partisans in the U.S.   PRO3 Die Anhänger der verschiedenen politischen Parteien in Deutschland sind sehr polarisiert.   Democratic and Republican partisans in the U.S. are very polarized.   PRO4 Die Meinungen zum Thema Immigration gehen in der deutschen Bevölkerung immer weiter auseinander.   Opinions about immigration issues are increasingly diverging in U.S. society.   PRO5 Es wird immer schwieriger, in der deutschen Bevölkerung Einigung zu Fragen der Immigration zu erreichen.   It is becoming increasingly difficult to reach agreement on immigration issues among the U.S. population.   PRO6 Das Thema Immigration spaltet die Menschen in Deutschland.   Immigration issues are dividing the people in the U.S.   Affective polarization Hier sehen Sie die Liste aller im Bundestag vertretenen Parteien. Bitte markieren Sie auf jeder der Skalen wie positiv oder negativ Sie für die jeweilige Partei empfinden. 0 (negative) to 100 (positive) In the following we would like to know about your party identification. Please mark on the scale how warm or cold you feel towards the respective parties. 0 (negative) to 100 (positive) CDU / Rep CDU   Republican       SPD / Dem SPD   Democrat   GRU GRU   -   FDP FDP   -   LIN LIN   -   AFD AFD   -   Political Scale (POL1) Wo würden Sie Ihren eigenen politischen Standpunkt auf der folgenden Skala einordnen? 11-point Likert Scale 1 = Links 6 = Mitte 11 = Rechts Where on the scale would you place your political point of view? 11-point Likert Scale 1 = Left 6 = Center 11 = Right Political Topics Bitte geben Sie an, inwiefern die folgenden Aussagen auf Sie zutreffen? 7-point Likert Scale 1 = Trifft überhaupt nicht zu 7 = Trifft voll und ganz zu Please indicate how strongly you agree or disagree with the following statements. 7-point Likert Scale 1 = Strongly disagree 7 = Strongly agree POL2 Ich interessiere mich im Allgemeinen sehr für Politik.   I am generally very interested in politics.   POL3 Ich informiere mich regelmäßig über das aktuelle politische Geschehen in Deutschland.   I regularly inform myself about current political affairs in the U.S..   POL4 Mir ist es wichtig, über das aktuelle politische Geschehen in Deutschland informiert zu sein.   It is important to me to be informed about current political affairs in the U.S..   POL5 Ich lese viele politische Nachrichtenartikel.   I read many political news articles.   POL6 Im Vergleich zu meinen Freunden bin ich ein Experte für das aktuelle politische Geschehen.   Compared to my friends, I am an expert on current political affairs.   POL7 Ich interessiere mich sehr für das Thema Immigration und die Immigrationspolitik in Deutschland.   I am very interested in the topic of immigration and U.S. immigration policy.   POL8 Ich informiere mich regelmäßig über Neuigkeiten zum Thema Immigration und Immigrationspolitik in Deutschland.   I try to keep up-to-date with news about immigration and U.S. immigration policy.   POL9 Mir ist es wichtig, über die aktuellen Entwicklungen zum Thema Immigration und Immigrationspolitik in Deutschland informiert zu sein.   It is important to me to be informed about current developments in the field of immigration and U.S. immigration policy.   Prosocial behavior Bitte geben Sie nachfolgend an wie sehr Sie den Aussagen zustimmen.   Please indicate how strongly you agree or disagree with the following statements.       PRO1 Ich wäre bereit, Gegenstände (z. B. Kleidung, Spielzeug, Möbel, Elektrogeräte) für Geflüchtete in Deutschland zu spenden. 7-point Likert Scale 1 = Stimme überhaupt nicht zu 7 = Stimme voll zu I would be willing to donate items (e.g. clothing, toys, furniture, electronics) to refugees living in the U.S. 7-point Likert Scale 1 = Strongly disagree 7 = Strongly agree PRO2 Ich wäre dazu bereit, Geflüchtete im Alltag zu unterstützen (z. B. Behördengänge begleiten, Deutschunterricht geben, eine gemeinsame Freizeitaktivität unternehmen). 7-point Likert Scale 1 = Stimme überhaupt nicht zu 7 = Stimme voll zu I would be willing to support refugees living in the U.S. with their everyday life (e.g. support with bureaucratic procedures, teaching English, leisure activities). 7-point Likert Scale 1 = Strongly disagree 7 = Strongly agree PRO3 Ich wäre bereit __ € für Geflüchtete in Deutschland zu spenden. float number >= 0 I am willing to make a one-time donation of __$ for refugees in the U.S. float number >= 0 PRO4 Wie häufig haben Sie beruflich (z. B. auf der Arbeit, im Studium) Kontakt mit Menschen mit Migrationshintergrund? 7-point Likert Scale 1 = Nie 7 = Sehr häufig How often do you have professional contact (e.g. at work or at school) with immigrants? 7-point Likert Scale 1 = Never 7 = Very often PRO5 Wie häufig haben Sie privat (z. B. Freunde, Verwandte, Bekannte) Kontakt mit Menschen mit Migrationshintergrund? 7-point Likert Scale 1 = Nie 7 = Sehr häufig How often do you have private contact (e.g. friends, relatives, acquaintances) with immigrants? 7-point Likert Scale 1 = Never 7 = Very often
创建时间:
2023-05-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作