Spaces:

Detomo
/

meisaicheck-api

Running

vumichien commited on Mar 3

Commit

e75b314

1 Parent(s): 04afa0e

change model, name mapping

Files changed (4) hide show

data/sampleData.csv CHANGED Viewed

The diff for this file is too large to render. See raw diff

data/sample_name_sentence_embeddings(cl-nagoya-sup-simcse-ja-for-standard-name-v1_1).pkl ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5da36a0b6c4a23bcc2cc567da344d0b94c2efe6d7986f7a1b7e5f6b7ff721c4a
+size 18017443

data/sample_name_sentence_similarities(cl-nagoya-sup-simcse-ja-for-standard-name-v1_1).pkl ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d942620d2940849fdee0f6cec443a5dd1f7f608144d4f1cee5ff66dd39797035
+size 137593306

main.py CHANGED Viewed

@@ -65,13 +65,13 @@ async def lifespan(app: FastAPI):
         # Load pre-computed embeddings and similarities
         with open(
-            f"data/sample_name_sentence_embeddings(cl-nagoya-sup-simcse-ja-base).pkl",
             "rb",
         ) as f:
             sample_name_sentence_embeddings = pickle.load(f)
         with open(
-            f"data/sample_name_sentence_similarities(cl-nagoya-sup-simcse-ja-base).pkl",
             "rb",
         ) as f:
             sample_name_sentence_similarities = pickle.load(f)
@@ -156,14 +156,15 @@ async def predict(file: UploadFile = File(...)):
         )
         df_predicted = nameMappingHelper.map_standard_names()
         # Create output dataframe and save to CSV - Fix SettingWithCopyWarning by creating a copy
-        columns_to_keep = ["ファイル名", "シート名", "行", "科目", "名称"]
-        output_df = inputData.dataframe[columns_to_keep].copy()
         # Use .loc to avoid SettingWithCopyWarning
         output_df.loc[:, COL_STANDARD_SUBJECT] = df_predicted[COL_STANDARD_SUBJECT]
-        output_df.loc[:, COL_STANDARD_NAME] = df_predicted[COL_STANDARD_NAME]
         output_df.loc[:, "参考_名称"] = df_predicted["参考_名称"]
-        output_df.loc[:, "出力_名称_類似度"] = df_predicted["出力_名称_類似度"]
         # Save with utf_8_sig encoding for Japanese Excel compatibility
         output_df.to_csv(output_file_path, index=False, encoding="utf_8_sig")

         # Load pre-computed embeddings and similarities
         with open(
+            f"data/sample_name_sentence_embeddings(cl-nagoya-sup-simcse-ja-for-standard-name-v1_1).pkl",
             "rb",
         ) as f:
             sample_name_sentence_embeddings = pickle.load(f)
         with open(
+            f"data/sample_name_sentence_similarities(cl-nagoya-sup-simcse-ja-for-standard-name-v1_1).pkl",
             "rb",
         ) as f:
             sample_name_sentence_similarities = pickle.load(f)
         )
         df_predicted = nameMappingHelper.map_standard_names()
         # Create output dataframe and save to CSV - Fix SettingWithCopyWarning by creating a copy
+        # columns_to_keep = ["ファイル名", "シート名", "行", "科目", "名称"]
+        # output_df = inputData.dataframe[columns_to_keep].copy()
+        output_df = inputData.dataframe.copy()
+        print(df_predicted.columns)
         # Use .loc to avoid SettingWithCopyWarning
         output_df.loc[:, COL_STANDARD_SUBJECT] = df_predicted[COL_STANDARD_SUBJECT]
+        output_df.loc[:, "出力_項目名"] = df_predicted["出力_項目名"]
         output_df.loc[:, "参考_名称"] = df_predicted["参考_名称"]
+        output_df.loc[:, "出力_確率度"] = df_predicted["出力_確率度"]
         # Save with utf_8_sig encoding for Japanese Excel compatibility
         output_df.to_csv(output_file_path, index=False, encoding="utf_8_sig")