(v1.7.1.9051) updated taxonomy, updated git branch name

2025-07-08 16:02:02 +02:00 · 2021-10-06 13:23:57 +02:00
parent 8f5e5a3fc2
commit 37e6e35ec4
139 changed files with 2694 additions and 1862 deletions
--- a/data-raw/AMR_latest.tar.gz
+++ b/data-raw/AMR_latest.tar.gz
--- a/data-raw/_internals.R
+++ b/data-raw/_internals.R
@ -95,7 +95,9 @@ create_species_cons_cops <- function(type = c("CoNS", "CoPS")) {
                                           "pulvereri", "rostri", "saccharolyticus", "saprophyticus",
                                           "sciuri", "simulans", "stepanovicii", "succinus",
                                           "ureilyticus",
-                                           "vitulinus", "vitulus", "warneri", "xylosus")
+                                           "vitulinus", "vitulus", "warneri", "xylosus",
+                                           "caledonicus", "canis",
+                                           "durrellii", "lloydii")
                   | (MO_staph$species == "schleiferi" & MO_staph$subspecies %in% c("schleiferi", ""))),
             "mo", drop = TRUE]
  } else if (type == "CoPS") {
@ -105,7 +107,8 @@ create_species_cons_cops <- function(type = c("CoNS", "CoPS")) {
                                           "delphini", "lutrae",
                                           "hyicus", "intermedius",
                                           "pseudintermedius", "pseudointermedius",
-                                           "schweitzeri", "simiae")
+                                           "schweitzeri", "simiae",
+                                           "roterodami")
                   | (MO_staph$species == "schleiferi" & MO_staph$subspecies == "coagulans")),
             "mo", drop = TRUE]
  }
--- a/data-raw/intrinsic_resistant.dta
+++ b/data-raw/intrinsic_resistant.dta
--- a/data-raw/intrinsic_resistant.md5
+++ b/data-raw/intrinsic_resistant.md5
@ -1 +1 @@
-9c58b2d894dbad7593cd44b78d04cd78
+43d5b2e1df4e0d12d6ad0c7a4591199c
--- a/data-raw/intrinsic_resistant.rds
+++ b/data-raw/intrinsic_resistant.rds
--- a/data-raw/intrinsic_resistant.sas
+++ b/data-raw/intrinsic_resistant.sas
--- a/data-raw/intrinsic_resistant.sav
+++ b/data-raw/intrinsic_resistant.sav
--- a/data-raw/intrinsic_resistant.txt
+++ b/data-raw/intrinsic_resistant.txt
--- a/data-raw/microorganisms.dta
+++ b/data-raw/microorganisms.dta
--- a/data-raw/microorganisms.old.dta
+++ b/data-raw/microorganisms.old.dta
--- a/data-raw/microorganisms.old.md5
+++ b/data-raw/microorganisms.old.md5
@ -1 +1 @@
-8338ff5f079f4519fa3c44f8c5bace64
+ee4434541c7b6529b391d2684748e28b
--- a/data-raw/microorganisms.old.rds
+++ b/data-raw/microorganisms.old.rds
--- a/data-raw/microorganisms.old.sas
+++ b/data-raw/microorganisms.old.sas
--- a/data-raw/microorganisms.old.sav
+++ b/data-raw/microorganisms.old.sav
--- a/data-raw/microorganisms.old.txt
+++ b/data-raw/microorganisms.old.txt
--- a/data-raw/microorganisms.rds
+++ b/data-raw/microorganisms.rds
--- a/data-raw/microorganisms.sas
+++ b/data-raw/microorganisms.sas
--- a/data-raw/microorganisms.sav
+++ b/data-raw/microorganisms.sav
--- a/data-raw/microorganisms.txt
+++ b/data-raw/microorganisms.txt
--- a/data-raw/mo.md5
+++ b/data-raw/mo.md5
@ -1 +1 @@
-82bd6236cf159569f6f5c99f48f92d86
+e8251824eec0b72d037b3dbfcdbe444a
--- a/data-raw/reproduction_of_microorganisms_update.R
+++ b/data-raw/reproduction_of_microorganisms_update.R
@ -23,8 +23,7 @@
 # how to conduct AMR data analysis: https://msberends.github.io/AMR/   #
 # ==================================================================== #

-# Register at List of Prokaryotic names with Standing in Nomenclature (LPSN)
-# then got to https://lpsn.dsmz.de/downloads and download the latest CSV file.
+# Go to https://lpsn.dsmz.de/downloads (register first) and download the latest CSV file.

 library(tidyverse)
 library(AMR)
@ -178,8 +177,7 @@ genera_without_mo_code <- updated_microorganisms %>%
  pull(genus) %>% 
  unique()

-genera_without_mo_code_abbr <- genera_without_mo_code %>% 
-  abbreviate_mo(5, prefix = "B_")
+genera_without_mo_code_abbr <- genera_without_mo_code %>% abbreviate_mo(5, prefix = "B_")
 genera_without_mo_code_abbr[genera_without_mo_code_abbr %in% microorganisms$mo] <- abbreviate_mo(genera_without_mo_code[genera_without_mo_code_abbr %in% microorganisms$mo], 6, prefix = "B_")
 genera_without_mo_code_abbr[genera_without_mo_code_abbr %in% microorganisms$mo] <- abbreviate_mo(genera_without_mo_code[genera_without_mo_code_abbr %in% microorganisms$mo], 7, prefix = "B_")
 # all unique??
@ -377,41 +375,6 @@ MOs.old <- microorganisms.old %>%
  # clean up
  df_remove_nonASCII()

-# Keep old codes for translation ------------------------------------------
-
-# add removed microbial IDs to the internal translation table so old package versions keep working
-# MOs.translation <- microorganisms %>% 
-#   filter(!mo %in% MOs$mo) %>%
-#   select(mo, fullname) %>%
-#   left_join(new_synonyms) %>% 
-#   left_join(MOs %>% transmute(fullname_new = fullname, mo2 = as.character(mo))) %>% 
-#   select(mo_old = mo, mo_new = mo2) %>% 
-#   distinct()
-# MOs.translation <- AMR:::microorganisms.translation %>% 
-#   left_join(MOs.translation %>% select(mo_new_update = mo_new, mo_new = mo_old)) %>% 
-#   mutate(mo_new = as.character(ifelse(!is.na(mo_new_update), mo_new_update, mo_new))) %>% 
-#   select(-mo_new_update) %>% 
-#   bind_rows(
-#     # old IDs used in microorganisms.codes must put in here as well
-#     microorganisms.codes %>%
-#       filter(!mo %in% MOs$mo) %>%
-#       transmute(mo_old = mo, fullname = mo_name(mo)) %>%
-#       left_join(MOs.old %>%
-#                   select(fullname, fullname_new)) %>%
-#       left_join(MOs %>%
-#                   select(mo_new = mo, fullname_new = fullname)) %>%
-#       transmute(mo_old = as.character(mo_old), mo_new)) %>% 
-#   arrange(mo_old) %>% 
-#   filter(mo_old != mo_new,
-#          !mo_old %in% MOs$mo) %>%
-#   left_join(., ., 
-#             by = c("mo_new" = "mo_old"), 
-#             suffix = c("", ".2")) %>%
-#   mutate(mo_new = ifelse(!is.na(mo_new.2), mo_new.2, mo_new)) %>% 
-#   distinct(mo_old, mo_new) %>% 
-#   # clean up
-#   df_remove_nonASCII()
-
 message("microorganisms new:     ", sum(!MOs$fullname %in% c(microorganisms$fullname, MOs.old$fullname)))
 message("microorganisms renamed: ", sum(!MOs.old$fullname %in% microorganisms.old$fullname))

@ -420,33 +383,49 @@ message("microorganisms renamed: ", sum(!MOs.old$fullname %in% microorganisms.ol

 # class <mo>
 class(MOs$mo) <- c("mo", "character")
-class(MOs.translation$mo_new) <- c("mo", "character")

 microorganisms <- MOs
 microorganisms.old <- MOs.old
-# microorganisms.translation <- MOs.translation
+
+# --- Moraxella catarrhalis was named Branhamella catarrhalis (Catlin, 1970), but this is unaccepted in clinical microbiology
+# we keep them both
+microorganisms <- microorganisms %>%
+  bind_rows(microorganisms %>%
+              filter(fullname == "Branhamella catarrhalis") %>%
+              mutate(mo = "B_MRXLL_CTRR",
+                     fullname = "Moraxella catarrhalis",
+                     genus = "Moraxella",
+                     ref = "Henriksen et al., 1968",
+                     species_id = "a374f6f0868e05f9c0f5077b60ee0a6c",
+                     snomed = as.list(24226003))) %>% 
+  arrange(fullname) %>% 
+  df_remove_nonASCII()
+microorganisms.old <- microorganisms.old %>% 
+  filter(fullname != "Moraxella catarrhalis")
+# ---
+
+# (this would be a great moment to run data-raw/snomed.R as well)

 # on the server, do:
 usethis::use_data(microorganisms, overwrite = TRUE, version = 2, compress = "xz")
-usethis::use_data(microorganisms.old, overwrite = TRUE, version = 2)
-# saveRDS(microorganisms.translation, file = "data-raw/microorganisms.translation.rds", version = 2)
+usethis::use_data(microorganisms.old, overwrite = TRUE, version = 2, compress = "xz")
 rm(microorganisms)
 rm(microorganisms.old)
-rm(microorganisms.translation)
-# to save microorganisms.translation internally to the package
-devtools::load_all(".")
-source("data-raw/_internals.R")
+
+# DON'T FORGET TO UPDATE R/globals.R!

 # load new data sets
 devtools::load_all(".")

 # reset previously changed mo codes
 rsi_translation$mo <- as.mo(rsi_translation$mo, language = NULL)
-usethis::use_data(rsi_translation, overwrite = TRUE, version = 2)
+usethis::use_data(rsi_translation, overwrite = TRUE, version = 2, compress = "xz")
 rm(rsi_translation)

 microorganisms.codes$mo <- as.mo(microorganisms.codes$mo, language = NULL)
-usethis::use_data(microorganisms.codes, overwrite = TRUE, version = 2)
+# new NAs introduced?
+any(is.na(microorganisms.codes$mo))
+usethis::use_data(microorganisms.codes, overwrite = TRUE, version = 2, compress = "xz")
 rm(microorganisms.codes)

 example_isolates$mo <- as.mo(example_isolates$mo, language = NULL)
--- a/data-raw/rsi_translation.dta
+++ b/data-raw/rsi_translation.dta
--- a/data-raw/rsi_translation.sas
+++ b/data-raw/rsi_translation.sas
--- a/data-raw/rsi_translation.sav
+++ b/data-raw/rsi_translation.sav
--- a/data-raw/snomed.R
+++ b/data-raw/snomed.R
@ -40,6 +40,7 @@ vctr <- unique(unlist(strsplit(c(microorganisms$fullname, microorganisms.old$ful
 vctr <- tolower(vctr[vctr %like% "^[a-z]+$"])

 # remove all parts of the name that are no valid values in genera, species or subspecies
+# this takes ~20 seconds
 snomed <- snomed %>% 
  mutate(fullname = vapply(FUN.VALUE = character(1),
                           # split on space and/or comma
@ -53,6 +54,8 @@ snomed_keep <- snomed %>%
  group_by(fullname_lower = fullname) %>% 
  summarise(snomed = list(snomed))

+message(nrow(snomed_keep), " MO's will get a SNOMED code.")
+
 # save to microorganisms data set
 microorganisms <- microorganisms %>%
  # remove old snomed
@ -64,6 +67,8 @@ microorganisms <- microorganisms %>%
  # remove dummy var
  select(-fullname_lower) %>% 
  AMR:::dataset_UTF8_to_ASCII()
-usethis::use_data(microorganisms, overwrite = TRUE, compress = "xz")

 # don't forget to update the version number in SNOMED_VERSION in ./R/globals.R!
+
+# usethis::use_data(microorganisms, overwrite = TRUE, version = 2, compress = "xz")
+