Spaces:

joko333
/

logical_structure_analysis

Sleeping

joko333 commited on Dec 14, 2024

Commit

41047a5

1 Parent(s): dd9aa69

Refactor BiLSTMAttentionBERT to use BiLSTMConfig for improved configuration management

Files changed (1) hide show

utils/model.py CHANGED Viewed

@@ -2,24 +2,28 @@ import torch
 import torch.nn as nn
 from transformers import PreTrainedModel, AutoModel, PretrainedConfig
 class BiLSTMAttentionBERT(PreTrainedModel):
-    def __init__(self, hidden_dim, num_classes, num_layers, dropout):
-        super().__init__(PretrainedConfig())
         self.bert = AutoModel.from_pretrained('dmis-lab/biobert-base-cased-v1.2')
-        self.lstm = nn.LSTM(768, hidden_dim, num_layers, batch_first=True, bidirectional=True)
-        self.dropout = nn.Dropout(dropout)
-        self.fc = nn.Linear(hidden_dim * 2, num_classes)
-    @classmethod
-    def from_pretrained(cls, model_path, hidden_dim, num_classes, num_layers, dropout):
-        model = cls(hidden_dim, num_classes, num_layers, dropout)
-        state_dict = torch.load(model_path, map_location='cpu')
-        model.load_state_dict(state_dict)
-        return model
     def forward(self, input_ids, attention_mask):
-        bert_output = self.bert(input_ids, attention_mask=attention_mask)[0]
         lstm_output, _ = self.lstm(bert_output)
         dropped = self.dropout(lstm_output[:, -1, :])
-        output = self.fc(dropped)
-        return output

 import torch.nn as nn
 from transformers import PreTrainedModel, AutoModel, PretrainedConfig
+class BiLSTMConfig(PretrainedConfig):
+    def __init__(self, hidden_dim=128, num_classes=22, num_layers=2, dropout=0.5, **kwargs):
+        super().__init__(**kwargs)
+        self.hidden_dim = hidden_dim
+        self.num_classes = num_classes
+        self.num_layers = num_layers
+        self.dropout = dropout
 class BiLSTMAttentionBERT(PreTrainedModel):
+    def __init__(self, config):
+        super().__init__(config)
+        self.config = config
         self.bert = AutoModel.from_pretrained('dmis-lab/biobert-base-cased-v1.2')
+        self.lstm = nn.LSTM(768, config.hidden_dim, config.num_layers,
+                           batch_first=True, bidirectional=True)
+        self.dropout = nn.Dropout(config.dropout)
+        self.fc = nn.Linear(config.hidden_dim * 2, config.num_classes)
     def forward(self, input_ids, attention_mask):
+        outputs = self.bert(input_ids, attention_mask=attention_mask)
+        bert_output = outputs[0]
         lstm_output, _ = self.lstm(bert_output)
         dropped = self.dropout(lstm_output[:, -1, :])
+        logits = self.fc(dropped)
+        return logits